You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
尝试过使用MNNConvert --fp16格式导出模型,但是使用apply-lora.py脚本时失败了。失败信息如下:
File "/byte_auto_model/jiangfeng/mnn/tools/script/apply_lora.py", line 72, in apply_lora
tag = names[1].split('.')[1] + names[3]
IndexError: list index out of range
(Pdb) names
['', 'q_proj', 'Add_output_0__matmul_converted']
实践中以Qwen2.5-0.5B-Instruct为基础模型,针对不同任务训练多个LoRA模型。训练工具为llamafactory-cli
训练后将基础模型进行8bit量化并导出mnn模型,并将多个LoRA模型导出为mnn格式。
在设备上进行验证【cpu + fp16】,发现准确率比量化前下降约15%~40%不等。
尝试过使用MNNConvert --fp16格式导出模型,但是使用apply-lora.py脚本时失败了。失败信息如下:
File "/byte_auto_model/jiangfeng/mnn/tools/script/apply_lora.py", line 72, in apply_lora
tag = names[1].split('.')[1] + names[3]
IndexError: list index out of range
(Pdb) names
['', 'q_proj', 'Add_output_0__matmul_converted']
也尝试过直接使用GPTQ的8bit量化版本进行LoRA sft然后转mnn格式,准确率没有提升。
这里想请教两个问题:
The text was updated successfully, but these errors were encountered: