Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

HuatuoGPT2-13B 测试 CMB 结果出入很大,在chat模板和prompt一致的情况下 #29

Open
Nero-gitg opened this issue May 9, 2024 · 8 comments

Comments

@Nero-gitg
Copy link

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢?
当然也可能是其他原因,期待你们的建议与回复!

@jymChen
Copy link
Contributor

jymChen commented Jun 25, 2024

@Nero-gitg 你好,
请问下使用的答题prompt是否和我们评测的一致,可以试试下面的prompt:

请回答下面选择题。 
对评估肝硬化患者预后意义不大的是
A. 腹水
B. 清蛋白
C. 血电解质
D. 凝血酶原时间

还有一点,最好不要限制Huatuo2的生成长度,Huatuo2经常会采用CoT的答案方式,选项结果往往在最后生成。

@xielinzhen
Copy link

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢? 当然也可能是其他原因,期待你们的建议与回复!

你好,请问复现成功了吗?可不可以分享一下 @Nero-gitg

@litsh
Copy link

litsh commented Jun 30, 2024

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢? 当然也可能是其他原因,期待你们的建议与回复!

你好,请问复现成功了吗?可不可以分享一下 @Nero-gitg

您好,请问您复现出来的结果是多少呢? @xielinzhen

@xielinzhen
Copy link

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢? 当然也可能是其他原因,期待你们的建议与回复!

你好,请问复现成功了吗?可不可以分享一下 @Nero-gitg

您好,请问您复现出来的结果是多少呢? @xielinzhen

和67.85查很远,你的多少呢?这是我的参数设置,不知道哪里错了

image

image

@xielinzhen
Copy link

xielinzhen commented Jul 1, 2024

这是结果

image

@litsh
Copy link

litsh commented Jul 1, 2024

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢? 当然也可能是其他原因,期待你们的建议与回复!

你好,请问复现成功了吗?可不可以分享一下 @Nero-gitg

您好,请问您复现出来的结果是多少呢? @xielinzhen

和67.85查很远,你的多少呢?这是我的参数设置,不知道哪里错了

image

image

@xielinzhen 你好,你的邮箱是多少呢?可以邮件交流。

@xielinzhen
Copy link

榜上分数67.85,本地测试相差很大。也可能是因为答案提取方式的不同,我查看huatuo模型输出,答案中包含选项信息的内容很少,想问下你们对模型生成答案的处理方式是怎么样的呢? 当然也可能是其他原因,期待你们的建议与回复!

你好,请问复现成功了吗?可不可以分享一下 @Nero-gitg

您好,请问您复现出来的结果是多少呢? @xielinzhen

和67.85查很远,你的多少呢?这是我的参数设置,不知道哪里错了
image
image

@xielinzhen 你好,你的邮箱是多少呢?可以邮件交流。

[email protected]

@jymChen
Copy link
Contributor

jymChen commented Aug 12, 2024

@xielinzhen 您好,感谢您的反馈。我们的QA评测代码开源了,可以通过下述命令复现:

accelerate launch evaluation/eval_qa.py --model_path=FreedomIntelligence/HuatuoGPT2-7B --data_path=./evaluation/data/eval_qa.json

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants