Oracle 23ai workshop - 向量数据库

Embedding模型部署（CPU）

考虑到硬件资源因素，没有足够的资源让每个人都部署一份模型，因此，本操作仅由讲师完成。讲师将向量嵌入模型部分为REST API 的方式，供大家调用。

环境安装

conda create -n ws23ai python=3.12

conda activate ws23ai

pip install -r requirements.txt

服务启动

先查看及编辑环境变量文件 app.env，确保文件中的设置正确，如数据库连接信息、模型路径等。再启动程序：

python main.py

LLM模型部署（GPU）

考虑到硬件资源因素，没有足够的资源让每个人都部署一份模型，因此，本操作仅由讲师完成。讲师将LLM模型部分为REST API 的方式，供大家调用。

下载模型

从魔搭社区 (modelscope) 下载：Qwen2-7B-Instruct

启动模型

我们采用vLLM来部署模型。vLLM是一个模型加速库，能大幅提升推理效率。

安装 vLLM：

conda create -n vllm python=3.12

conda activate vllm

pip install vllm

启动运行：

 python -m vllm.entrypoints.openai.api_server --port 8098 --model /home/ubuntu/ChatGPT/Models/Qwen/Qwen2-7B-Instruct  --served-model-name Qwen2-7B-Instruct --device=cuda --dtype auto --max-model-len=2048

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
data/01-Oracle运维知识库		data/01-Oracle运维知识库
image		image
.gitignore		.gitignore
MyTOs.py		MyTOs.py
Oracle向量数据库_lab1.md		Oracle向量数据库_lab1.md
Oracle向量数据库_lab2.md		Oracle向量数据库_lab2.md
README.md		README.md
app.env		app.env
load_utils.py		load_utils.py
main.py		main.py
requirements.txt		requirements.txt
rest_controller.py		rest_controller.py
向量数据库动手实验_Lab1.docx		向量数据库动手实验_Lab1.docx
向量数据库动手实验_Lab1_v2.pdf		向量数据库动手实验_Lab1_v2.pdf
向量数据库动手实验_Lab2.docx		向量数据库动手实验_Lab2.docx
向量数据库动手实验_Lab2_v2.pdf		向量数据库动手实验_Lab2_v2.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Oracle 23ai workshop - 向量数据库

Embedding模型部署（CPU）

环境安装

服务启动

LLM模型部署（GPU）

下载模型

启动模型

About

Releases

Packages

Languages

HysunHe/23ai_workshop_prep

Folders and files

Latest commit

History

Repository files navigation

Oracle 23ai workshop - 向量数据库

Embedding模型部署（CPU）

环境安装

服务启动

LLM模型部署（GPU）

下载模型

启动模型

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages