介绍

本项目实现算能BM1688和CV168AH部署各类开源生成式AI模型，主要是70亿参数量以内的大语言模型。

我们已经部署过的开源模型如下：

Model	INT4	Huggingface Link
ChatGLM3-6B	✅	LINK
Qwen1.5-1.8B	✅	LINK
Qwen2.5-1.5B	✅	LINK
Llama2-7B	✅	LINK
MiniCPM-2B	✅	LINK
Phi-3-3.8B	✅	LINK
Gemma2-2B	✅	LINK
OpenClip	✅	LINK
InternVL2-4B	✅	LINK
InternVL2-2B	✅	LINK
MiniCPM-V-2_6	✅	LINK
Molmo-7B-D-0924	✅	LINK

如果您想要知道转换细节和源码，可以到本项目models子目录查看各类模型部署细节。

如果您想看看演示效果，可以根据Quick Start内容操作即可。

如果您对我们的芯片感兴趣，也可以通过官网SOPHGO联系我们。

Quick Start

如果您手上有BM1688或CV168AH的开发板，那么可以参考以下步骤跑通大语言模型，这里以Qwen1.5-1.8B为例。

跑通Demo

git clone https://github.com/sophgo/LLM-TPU_Lite.git
./run.sh --model qwen1.5

效果图

跑通后效果如下图所示

Command Table

目前用于演示的模型，全部命令如下表所示

Model	Commnad
ChatGLM3-6B	./run.sh --model chatglm3
Llama2-7B	./run.sh --model llama2
Qwen1.5-1.8B	./run.sh --model qwen1.5
Qwen2.5-1.5B	./run.sh --model qwen2.5
MiniCPM-2B	./run.sh --model minicpm
Phi-3-3.8B	./run.sh --model phi-3
Gemma2-2B	./run.sh --model gemma2
OpenClip	./run.sh --model openclip
InternVL2-2B	./run.sh --model internvl2
MiniCPM-V-2_6	./run.sh --model minicpmv2_6
Molmo-7B-D-0924	./run.sh --model molmo-7b

常见问题

Q1：如果我的环境没有联网，那么怎么跑通大语言模型？

A：您可以先在联网的大机器上git clone本项目，之后运行 ./run.sh --model qwen1.5

然后把LLM-TPU_Lite的全部文件拷贝到开发板上，必须要是全部文件，包括LLM-TPU_Lite/models，LLM-TPU_Lite/sg_llm

最后再在开发板上运行 ./run.sh --model qwen1.5

Name		Name	Last commit message	Last commit date
Latest commit History 113 Commits
assets		assets
harness		harness
models		models
sg_llm		sg_llm
.clang-format		.clang-format
.clang-tidy		.clang-tidy
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
envsetup.sh		envsetup.sh
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

介绍

Quick Start

跑通Demo

效果图

Command Table

常见问题

Q1：如果我的环境没有联网，那么怎么跑通大语言模型？

About

Releases

Packages

Contributors 6

Languages

sophgo/LLM-TPU_Lite

Folders and files

Latest commit

History

Repository files navigation

介绍

Quick Start

跑通Demo

效果图

Command Table

常见问题

Q1：如果我的环境没有联网，那么怎么跑通大语言模型？

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 6

Languages

Packages