哔哩哔哩聊天机器人

由哔哩哔哩用户评论微调训练而成的本地聊天机器人。支持文字聊天，也可以通过 questions.txt 生成针对给定问题的语音对话。

本项目文字生成使用的基础模型为 Qwen1.5-32B-Chat，借助苹果 mlx-lm LORA 示例项目对基础模型进行微调训练。语音生成部分基于开源项目 GPT-SoVITS，问题语音来自 B 站用户白菜工厂1145号员工训练的派蒙语音模型。

文件结构

项目主要脚本存放在 main/ 文件夹下，模型存放于 models/ 文件夹。提示词模板、问题列表存放在 text/ 文件夹下。tools/compress_model.py 可以对完整模型进行量化压缩，大大加快模型内容生成速度。

运行指南

本项目基于 Python 编程语言，程序运行使用的 Python 版本为 3.10，建议使用 Anaconda 配置 Python 环境。以下配置过程已在 macOS 系统测试通过。

配置环境

conda create -n bilibot python=3.10
conda activate bilibot
cd bilibot
pip install -r requirements.txt

模型微调训练与推理测试

使用控制台指令，借助 mlx-lm 对 Qwen1.5-32B-Chat 进行微调：

python -m mlx_lm.lora --model models/Qwen1.5-32B-Chat --data data/ --train --iters 1000 --batch-size 16 --lora-layers 12

将微调后的 adapters 文件与基础模型合并：

python -m mlx_lm.fuse --model models/Qwen1.5-32B-Chat --save-path models/Qwen1.5-32B-Chat-FT --adapter-path models/Qwen1.5-32B-Chat-Adapters

对合并后的模型进行量化加速： python tools/compress_model.py

对微调训练后的模型进行对话测试： python chat.py

语音生成

本项目借助开源项目 GPT-SoVITS 进行语音生成。

首先参考 GPT-SoVITS 的官方指南配置环境并运行语音生成程序。

conda create -n GPTSOVITS python=3.9
conda activate GPTSOVITS
cd GPT-SoVITS
pip install -r requirements.txt
python webui.py

运行 api 程序，分别使用端口 9880 与 9881 提供派蒙与林亦的语音生成服务，以下请使用 GPT-SoVITS 代码库完成：

python api.py -s SoVITS_weights/paimeng2_e110_s159940.pth -g GPT_weights/paimeng2-e10.ckpt -dr samples/Paimon/疑问—哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？.wav -dt "哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？" -dl "zh" -a 127.0.0.1 -p 9880
python api.py -s SoVITS_weights/linyi_e25_s1150.pth -g GPT_weights/linyi-e50.ckpt -dr "samples/linyi/【愤怒】你这问题太弱智了，我都不知道该从哪开始骂你。.WAV" -dt "你这问题太弱智了，我都不知道该从哪开始骂你。" -dl "zh" -a 127.0.0.1 -p 9881

运行问答生成程序：

python start_qa_dialogue.py

参考

机器学习框架 MLX，来自苹果机器学习研究组：https://github.com/ml-explore/mlx
阿里通义千问 Qwen1.5：https://qwenlm.github.io/zh/blog/qwen1.5/
开源文本转语音项目 GPT-SoVITS，作者花儿不哭：https://github.com/RVC-Boss/GPT-SoVITS
派蒙语音模型，作者白菜工厂1145号员工：【GPT-SoVITS】30小时超大数据集测试，堆时长真的有用吗？

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
data		data
main		main
text		text
tools		tools
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

哔哩哔哩聊天机器人

文件结构

运行指南

配置环境

模型微调训练与推理测试

语音生成

参考

About

Releases

Packages

Languages

License

Luc-Webster/bilibot

Folders and files

Latest commit

History

Repository files navigation

哔哩哔哩聊天机器人

文件结构

运行指南

配置环境

模型微调训练与推理测试

语音生成

参考

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages