文件语义检索

一个轻量级基于大模型解析的多模态文件语义检索工具，不同于传统基于文件名或metadata检索的方式，该工具可实现基于文件内容的语义检索，支持各类主流格式文档、图片、音频、视频。

Read this in English

架构

Demo

retrieve_image.mp4

快速开始

安装依赖

pip install -r requirements.txt

在项目根目录创建.env配置文件，配置OLLAMA_BASE_URL（使用本地ollama服务）或GLM_API_KEY（使用智谱AI开放平台服务）
运行项目

streamlit run main.py

Docker部署

使用项目自带的Dockerfile构建镜像

docker build -t semantic-file-retrieval:latest .

运行容器

docker run -d -e OLLAMA_BASE_URL="http://x.x.x.x:11434" -p 8501:8501 semantic-file-retrieval:latest

.env文件中的所有配置均可通过docker运行命令的环境变量参数覆盖

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.streamlit		.streamlit
assets		assets
core		core
pages		pages
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
main.py		main.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

文件语义检索

架构

Demo

快速开始

Docker部署

TODO

About

Releases

Packages

Languages

License

SignitDoc/semantic-file-retrieval

Folders and files

Latest commit

History

Repository files navigation

文件语义检索

架构

Demo

快速开始

Docker部署

TODO

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages