Skip to content

Latest commit

 

History

History
131 lines (76 loc) · 3.29 KB

README.md

File metadata and controls

131 lines (76 loc) · 3.29 KB

Quick Start LLM

快速启动自托管、可扩展、管理友好的LLM环境,使用One-Api分发和管理Key

目前支持的LLM

目前支持的推理工具

快速启动

默认使用ChatGLM3-6B模型,4bit量化,OpenAI格式的Api启动,使用GPU推理。

前提

暂不支持AMD显卡和苹果M系列GPU。

带有Nvidai显卡(显存>=8GB),并且已经正确安装驱动的WindowsLinux环境。

或者使用CPU推理的WindowsLinuxMacOS环境。

Docker

Docker-compsoe

下载模型

如果提示没有lfs命令,则需要安装git-lfsDebian / Ubuntu系统可执行此命令安装sudo apt-get install git-lfs

仓库根目录执行

git lfs install

进入模型目录

cd ./models/THUDM

下载模型

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

配置文件

复制.env.template.env

cp .env.template .env

启动

docker-compose up -d

配置

打开One-Api http://ServerIP:3000/login

初始账号用户名为 root,密码为 123456,修改初始密码。

点击导航栏渠道,添加本地启动的ChatGML3到渠道。

可参考以下值填写:

类型:自定义渠道

Base URL:http://serverip:8000

名称:ChatGLM3-6B

分组:default

模型:gpt-3.5-turbo

模型重定向:-

密钥:none

add-channel

填写完毕后点击提交

点击导航栏渠道按钮,点击新添加的渠道测试按钮,测试成功则代表本地ChatGLM3已启动成功。

至此,已经把本地ChatGLM3,添加到了One-Api。可以通过One-Api分发密钥,此密钥可直接用于兼容OpenAI APIChatGPT程序。

分发密钥

完成以上部分之后,我们可以开始分发并使用密钥了。这里以ChatGPT Next Web为例。

点击创建新的令牌,选择参数,创建完毕后,复制令牌,选择 ChatGPT Next Web

copy-key

这里复制的格式如下,只需要Key部分sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04

https://chat.oneapi.pro/#/?settings={"key":"sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04","url":"http://localhost:3000"}

打开http://ServerIP:3001/,点击左下角设置,勾选自定义接口按钮,填写接口地址为One-Api地址http://ServerIP:3000API_KEY一栏填写上一步拿到的Key sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04

chatgpt-next-web-config

演示 demo

至此,整个环境搭建完成。

致谢

One-Api:OpenAI 接口管理 & 分发系统;

ChatGLM3:开源双语对话语言模型;

ChatGPT-Next-Web:跨平台 ChatGPT 应用;