add glm4 reward model tutorial & bugfix qwen2 dpo readme #101

coder-yuzhiwei · 2024-11-08T08:10:24Z

ChessQian · 2024-11-14T09:16:03Z

examples/dpo/qwen2/README.md

+# model:       模型名称
+# input_path:  下载HuggingFace权重的文件夹路径，注意最后面有/
+# output_path: 转换后的MindSpore权重文件保存路径
+# dtype:       转换权重的精度
 ```



readme里面贴一下最后的eval结果

这里是修改qwen2里的文档错误，在reward model里的readme中，已经贴了eval的结果。

coder-yuzhiwei changed the title ~~bugfix qwen2 dpo readme~~ add glm4 reward model tutorial & bugfix qwen2 dpo readme Nov 14, 2024

ChessQian reviewed Nov 14, 2024

View reviewed changes

add glm4 reward model tutorial

8851bbd

coder-yuzhiwei force-pushed the master branch from e1382bd to 8851bbd Compare November 14, 2024 09:24

Provide feedback