Skip to content

Latest commit

 

History

History
42 lines (24 loc) · 916 Bytes

README.md

File metadata and controls

42 lines (24 loc) · 916 Bytes

Train Custom LLM

探索LLM更多有趣的玩法

微调方式

模型运行

直接加载基座模型启动

CUDA_VISIBLE_DEVICES=0 python.py webui.py --model {模型类型如 baichuan, chatGLM} --model_ckpt {模型权重文件路径}

添加lora权重,使用量化方法运行

CUDA_VISIBLE_DEVICES=0 python.py webui.py --model {模型类型如 baichuan, chatGLM} --model_ckpt {模型权重文件路径} --lora_ckpt {lora权重文件路径} --quantize {4bit, 8bit}

支持模型类型

  • chatGLM1/2
  • baichuan-7B

Dataset

Reference