deepseek微调后进行推理输出混乱 #6908

HelloWorld506 · 2025-02-12T03:36:37Z

最新版llamafactory

我微调了deepseek-qwen-7B模型，我的输出只有A，B，C，训练时准确率很高，但是推理时会输出思维链，甚至会有<|im_start|>user类似的在input中的词，请问训练时是做了什么操作让其不输出思维链吗，另外推理时输出在input中的词是为什么呢，应该如何解决呢

No response

Haroldhy · 2025-02-14T08:48:45Z

什么叫训练的时候准确率很高，训练准确率是意思？推理时又是什么意思，用webui推理还是transformers还是别的什么框架

HelloWorld506 added bug Something isn't working pending This problem is yet to be addressed labels Feb 12, 2025

Provide feedback