🚀 Projet RAG avec DeepSeek, Azure et LangChain

Ce projet implémente un système RAG (Retrieval-Augmented Generation) en connectant DeepSeek à une base de données sur Azure et en utilisant LangChain pour le traitement des documents.

Sommaire

Objectifs du projet
Technologies utilisées
Structure du projet
Installation et Setup
Fonctionnalités principales
TODO
Contribution

📌 Objectifs du projet

Mettre en place une interface utilisateur avec Streamlit
Déployer un modèle DeepSeek local pour répondre aux questions avec un contexte
Stocker les documents traités dans une base de données Azure
Préparer et splitter les documents avec LangChain
Vectoriser les documents avec OpenAI Embeddings / DeepSeek / GraphRAG
Implémenter une retrieval function efficace avec LangChain
Tester et optimiser les paramètres (taille des splits, nombre d'extraits, etc.)
Développer une fonction de reward pour affiner les réponses

🛠️ Technologies utilisées

Outil / Techno	Rôle
Python	LangChain, DeepSeek, OpenAI, Neo4j, NetworkX, ArangoDB
Streamlit	Interface utilisateur
Azure	Base de données
LangChain	Traitement et retrieval des documents
Git / GitHub	Versionnement et collaboration

📂 Structure du projet

📦 Projet
├── 📂 data                # Documents sources
├── 📂 notebooks           # Tests et prototypes
├── 📂 src                 # Code source principal
│   ├── main.py           # Lancement de l'application
│   ├── ui.py             # Interface Streamlit
│   ├── deepseek.py       # Configuration du modèle DeepSeek
│   ├── db_setup.py       # Setup de la base Azure
│   ├── document_split.py # Split des documents avec LangChain
│   ├── vectorization.py  # Vectorisation des textes
│   ├── retrieval.py      # Fonction de recherche (RAG)
│   ├── reward.py         # Fonction de reward (ajustement auto)
│   ├── config.py         # Configuration générale
├── .gitignore            # Fichiers à ignorer pour Git
├── requirements.txt      # Dépendances Python
├── README.md             # Documentation du projet

🚀 Installation et Setup

1️⃣ Cloner le projet

git clone https://github.com/Alexadnre/LLM-on-premise
cd Projet

2️⃣ Créer un environnement virtuel et installer les dépendances

python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt

3️⃣ Installer et pull le modèle Deepseek with ollama

ollama run deepseek-r1:8b

4️⃣ Lancer l'application

streamlit run src/main.py

💡 Fonctionnalités principales

✅ Interface utilisateur avec Streamlit
✅ Base de données Azure pour stocker les documents
✅ DeepSeek local pour répondre aux questions avec contexte
✅ Préparation et split des documents via LangChain
✅ Vectorisation des documents avec DeepSeek / GraphRAG
✅ Retrieval intelligent pour trouver les passages pertinents
✅ Optimisation du modèle en ajustant les paramètres
✅ Fonction de reward pour améliorer la pertinence des réponses

📅 TODO

Mettre en place l'interface utilisateur graphique avec Streamlit
Télécharger et configurer DeepSeek
Déployer la base de données sur Azure
Implémenter la vectorisation des documents
Tester différentes stratégies de split
Ajuster la retrieval function pour améliorer la précision

🤝 Contribution

Les contributions sont les bienvenues ! Si vous souhaitez contribuer :

Fork le projet
Créez une branche pour votre fonctionnalité (git checkout -b feature-nouvelle-fonction)
Committez vos modifications (git commit -m "Ajout d'une nouvelle fonctionnalité")
Poussez vers votre branche (git push origin feature-nouvelle-fonction)
Ouvrez une Pull Request
Bravo

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 Projet RAG avec DeepSeek, Azure et LangChain

Sommaire

📌 Objectifs du projet

🛠️ Technologies utilisées

📂 Structure du projet

🚀 Installation et Setup

1️⃣ Cloner le projet

2️⃣ Créer un environnement virtuel et installer les dépendances

3️⃣ Installer et pull le modèle Deepseek with ollama

4️⃣ Lancer l'application

💡 Fonctionnalités principales

📅 TODO

🤝 Contribution

About

Releases

Packages

Contributors 3

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Alexadnre/LLM-on-premise

Folders and files

Latest commit

History

Repository files navigation

🚀 Projet RAG avec DeepSeek, Azure et LangChain

Sommaire

📌 Objectifs du projet

🛠️ Technologies utilisées

📂 Structure du projet

🚀 Installation et Setup

1️⃣ Cloner le projet

2️⃣ Créer un environnement virtuel et installer les dépendances

3️⃣ Installer et pull le modèle Deepseek with ollama

4️⃣ Lancer l'application

💡 Fonctionnalités principales

📅 TODO

🤝 Contribution

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages