GitHub - monkeywl2020/llama_index_mutiModel_Rag: llama index多模态RAG，自定义Embedding支持“图片+图片描述”的Embedding方式，提高多模态RAG准确性

本工程是llama index支持多模态RAG的工程。

1：llama index的多模态 rag，文本和图像的Embedding都是独立。目前支持多模态的Embedding 还有图片描述文字+图片这种方式进行Embedding的。经过测试，这种相似性查找准确率比较高。所以进行了修改。

2：新增了个自定义的 wlMultiModalVectorStoreIndex 继承自 llama index的MultiModalVectorStoreIndex。 wlMultiModalEmbedding 继承自 MultiModalEmbedding。

3：此外使用本地llm大模型还需要修改下llama index的 llama_index/multi_modal_llms/openai/utils.py 文件内容。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
asl_data		asl_data
llama_index/multi_modal_llms/openai		llama_index/multi_modal_llms/openai
README.md		README.md
wl_MultiModal_VectorStoreIndex.py		wl_MultiModal_VectorStoreIndex.py
wl_custom_embeding.py		wl_custom_embeding.py
wl_test_mutil_rag.py		wl_test_mutil_rag.py

Provide feedback