finetune_dataset_maker

注：新版的openai包改了api接口的用法，要使用现有代码请安装旧版，pip install openai==0.28.0

pip安装最新版的streamlit和openai，执行这一句即可运行（port可以随便改）

streamlit run dataset.py --server.port 2323

支持以下ChatGLM微调项目的格式

主要功能是读取用户写在txt的问题，并通过GPT生成回答，或者用户自行撰写回答，然后保存为微调需要的json文件

首先打开网页，我们可以选择要回答的问题，选定之后填写答案，也可以选择使用GPT的api来流式生成回答，确认并进入下一个问题

如果回答为空的话，就会删掉未保存的对应回答

保存全部回答，可以将回答序列化写入本地文件以便下次读取。

导出Json的话，会将所有已保存回答写到本地而未保存的回答就会忽略。

用代理的同学记得按照左边的端口号修改代码，不用代理请删掉这两行

改这里切换输出json的格式

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
LICENSE		LICENSE
README.md		README.md
answers.json		answers.json
dataset.py		dataset.py
questions.txt		questions.txt

Provide feedback