介绍

本项目实现算能BM1688和CV168AH部署各类开源生成式AI模型，主要是70亿参数量以内的大语言模型。

我们已经部署过的开源模型如下：

如果您想要知道转换细节和源码，可以到本项目models子目录查看各类模型部署细节。

如果您想看看演示效果，可以根据Quick Start内容操作即可。

如果您对我们的芯片感兴趣，也可以通过官网SOPHGO联系我们。

Quick Start

如果您手上有BM1688或CV168AH的开发板，那么可以参考以下步骤跑通大语言模型，这里以Qwen1.5-1.8B为例。

git clone https://github.com/sophgo/LLM-TPU_Lite.git
./run.sh --model qwen1.5

跑通后效果如下图所示

目前用于演示的模型，全部命令如下表所示

A：您可以先在联网的大机器上git clone本项目，之后运行 ./run.sh --model qwen1.5

然后把LLM-TPU_Lite的全部文件拷贝到开发板上，必须要是全部文件，包括LLM-TPU_Lite/models，LLM-TPU_Lite/sg_llm

最后再在开发板上运行 ./run.sh --model qwen1.5