HuatuoGPT2-13B 测试 CMB 结果出入很大，在chat模板和prompt一致的情况下 #29

Nero-gitg · 2024-05-09T04:42:42Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？
当然也可能是其他原因，期待你们的建议与回复！

jymChen · 2024-06-25T07:12:24Z

@Nero-gitg 你好，
请问下使用的答题prompt是否和我们评测的一致，可以试试下面的prompt:

请回答下面选择题。 
对评估肝硬化患者预后意义不大的是
A. 腹水
B. 清蛋白
C. 血电解质
D. 凝血酶原时间

还有一点，最好不要限制Huatuo2的生成长度，Huatuo2经常会采用CoT的答案方式，选项结果往往在最后生成。

xielinzhen · 2024-06-28T09:12:04Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？当然也可能是其他原因，期待你们的建议与回复！

你好，请问复现成功了吗？可不可以分享一下 @Nero-gitg

litsh · 2024-06-30T13:05:48Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？当然也可能是其他原因，期待你们的建议与回复！

你好，请问复现成功了吗？可不可以分享一下 @Nero-gitg

您好，请问您复现出来的结果是多少呢？ @xielinzhen

xielinzhen · 2024-07-01T00:39:20Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？当然也可能是其他原因，期待你们的建议与回复！

你好，请问复现成功了吗？可不可以分享一下 @Nero-gitg

您好，请问您复现出来的结果是多少呢？ @xielinzhen

和67.85查很远，你的多少呢？这是我的参数设置，不知道哪里错了

xielinzhen · 2024-07-01T00:46:00Z

这是结果

litsh · 2024-07-01T09:03:25Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？当然也可能是其他原因，期待你们的建议与回复！

你好，请问复现成功了吗？可不可以分享一下 @Nero-gitg

您好，请问您复现出来的结果是多少呢？ @xielinzhen

和67.85查很远，你的多少呢？这是我的参数设置，不知道哪里错了

@xielinzhen 你好，你的邮箱是多少呢？可以邮件交流。

xielinzhen · 2024-07-02T02:04:18Z

榜上分数67.85，本地测试相差很大。也可能是因为答案提取方式的不同，我查看huatuo模型输出，答案中包含选项信息的内容很少，想问下你们对模型生成答案的处理方式是怎么样的呢？当然也可能是其他原因，期待你们的建议与回复！

你好，请问复现成功了吗？可不可以分享一下 @Nero-gitg

您好，请问您复现出来的结果是多少呢？ @xielinzhen

和67.85查很远，你的多少呢？这是我的参数设置，不知道哪里错了



@xielinzhen 你好，你的邮箱是多少呢？可以邮件交流。

[email protected]

jymChen · 2024-08-12T13:43:40Z

@xielinzhen 您好，感谢您的反馈。我们的QA评测代码开源了，可以通过下述命令复现：

accelerate launch evaluation/eval_qa.py --model_path=FreedomIntelligence/HuatuoGPT2-7B --data_path=./evaluation/data/eval_qa.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HuatuoGPT2-13B 测试 CMB 结果出入很大，在chat模板和prompt一致的情况下 #29

HuatuoGPT2-13B 测试 CMB 结果出入很大，在chat模板和prompt一致的情况下 #29

Nero-gitg commented May 9, 2024

jymChen commented Jun 25, 2024

xielinzhen commented Jun 28, 2024

litsh commented Jun 30, 2024

xielinzhen commented Jul 1, 2024

xielinzhen commented Jul 1, 2024 •

edited

Loading

litsh commented Jul 1, 2024

xielinzhen commented Jul 2, 2024

jymChen commented Aug 12, 2024

HuatuoGPT2-13B 测试 CMB 结果出入很大，在chat模板和prompt一致的情况下 #29

HuatuoGPT2-13B 测试 CMB 结果出入很大，在chat模板和prompt一致的情况下 #29

Comments

Nero-gitg commented May 9, 2024

jymChen commented Jun 25, 2024

xielinzhen commented Jun 28, 2024

litsh commented Jun 30, 2024

xielinzhen commented Jul 1, 2024

xielinzhen commented Jul 1, 2024 • edited Loading

litsh commented Jul 1, 2024

xielinzhen commented Jul 2, 2024

jymChen commented Aug 12, 2024

xielinzhen commented Jul 1, 2024 •

edited

Loading