diff --git a/inference/benchmarks/stable_diffusion_v1_4/README.md b/inference/benchmarks/stable_diffusion_v1_4/README.md index c73c77b4a..7bc87bbc4 100644 --- a/inference/benchmarks/stable_diffusion_v1_4/README.md +++ b/inference/benchmarks/stable_diffusion_v1_4/README.md @@ -1,5 +1,6 @@ ### 1. 推理数据集 +* 采用vizwiz的image captioning验证数据集,下载链接为https://vizwiz.cs.colorado.edu/VizWiz_final/images/val.zip ### 2. 模型与权重 diff --git a/training/benchmarks/chatglm3_6b/deepspeed/README.md b/training/benchmarks/chatglm3_6b/deepspeed/README.md index 2ed8251ae..c18cec75e 100644 --- a/training/benchmarks/chatglm3_6b/deepspeed/README.md +++ b/training/benchmarks/chatglm3_6b/deepspeed/README.md @@ -28,4 +28,6 @@ ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话 执行preprocess/data_process.py,配置好其中的4个命令行参数。推荐的默认token数量为100M,即1亿个token。此配置在A800 8卡上预计训练1小时 -4. 将outputfile(通常为openwebtext_chatglm3_100M.npy)放置在data_dir下 \ No newline at end of file +4. 将outputfile(通常为openwebtext_chatglm3_100M.npy)放置在data_dir下 + +值得注意的是,由于原始Google Drive存储内容变动,自2024.03起,可忽略上述第1步骤,从链接中下载20个子压缩目录,随后全部解压到同一个目录,继续执行第3、4步骤。