Guide pour Déployer une API de Prédiction Iris avec un Pipeline CI/CD sur Render

Ce projet implémente une API Flask permettant de prédire la classe d'une fleur Iris à partir de ses caractéristiques, accompagnée d'une documentation Swagger. Le projet inclut également un pipeline CI/CD complet utilisant GitHub Actions pour automatiser les tests et le déploiement de l'application sur Render, avec une image Docker hébergée sur Docker Hub.

Table des matières

Introduction et description du projet
Fonctionnalités
Prérequis
Installation
Structure du projet
Exécution de l'API en local avec Python
Simulation de l'environnement de production avec Docker
Automatisation du déploiement avec un pipeline CI/CD
Tester l'API en production
Améliorations futures

Introduction et description du projet

Ce projet a pour but de démontrer une approche complète de développement d'une API de prédiction utilisant le modèle RandomForestClassifier de scikit-learn, avec une intégration complète de CI/CD (Continuous Integration/Continuous Deployment).

Grâce à cette API, vous pourrez prédire la classe d'une fleur Iris à partir de ses caractéristiques florales (longueur et largeur des sépales et des pétales). L'API est documentée via Swagger UI pour faciliter l'interaction avec les différents endpoints.

Un pipeline CI/CD est mis en place avec GitHub Actions pour automatiser les tests, la construction d'une image Docker, et le déploiement de l'application sur la plateforme Render. Ce pipeline permet une gestion fluide des déploiements en production tout en garantissant la qualité grâce à des tests automatisés.

Fonctionnalités

Prédiction : Fournit la classe prédite (Setosa, Versicolor, Virginica) d'une fleur Iris à partir de 4 caractéristiques.
Documentation Swagger : Swagger UI est intégré pour documenter les endpoints disponibles.
CI/CD Automatisé : Tests unitaires, construction d'une image Docker, et déploiement automatisé sur Render via GitHub Actions.
Validation des données : Validation des données d'entrée avant la prédiction pour s'assurer que les entrées sont correctes.
Modularité : Organisation modulaire du code pour une meilleure maintenabilité.

Prérequis

Avant de commencer, assurez-vous d'avoir les éléments suivants :

Python
GitHub et un dépôt Git
Compte Render (pour héberger l'application)
Compte Docker Hub (pour héberger l'image Docker de l'application)

Installation

Cloner le dépôt Git :

git clone https://github.com/mnassrib/iris-api.git
cd iris-api

Installer les dépendances :
```
pip install -r requirements.txt
```
Entraîner le modèle (si le modèle n'est pas encore disponible dans le dossier models) :
```
python train_model.py
```

Structure du projet

La structure du projet est la suivante :

iris-api
├── app.py
├── train_model.py
├── models
│   └── iris_model.pkl
├── utils
│   ├── model_utils.py
│   └── validation.py
├── swagger
│   ├── index.yml
│   └── predict.yml
├── tests
│   └── __init__.py
│   └── test_app.py
├── Dockerfile
├── requirements.txt
├── .gitignore
├── README.md
└── .github
    └── workflows
        └── ci-cd.yml

Explication des fichiers principaux :

app.py : Fichier principal de l'API. Il contient les routes pour les prédictions et la page d'accueil.
train_model.py : Script pour entraîner le modèle RandomForestClassifier et le sauvegarder.
models/iris_model.pkl : Modèle pré-entraîné utilisé pour faire des prédictions.
utils/model_utils.py : Contient la fonction de chargement du modèle.
utils/validation.py : Contient la fonction de validation des données d'entrée.
utils/swagger_config.py : Contient le template de configuration de Swagger.
swagger/ : Contient les fichiers YAML définissant la documentation Swagger pour les différents endpoints.
tests/test_app.py : Tests unitaires pour valider le bon fonctionnement de l'API.
__init__.py : Fichier qui indique à Python que le répertoire doit être traité comme un module, souvent utilisé pour initialiser des packages et gérer les imports au sein du répertoire.
.gitignore : Fichier pour exclure certains fichiers ou répertoires du suivi de version Git, tels que les fichiers générés automatiquement ou les données sensibles.
.github/workflows/ci-cd.yml : Pipeline CI/CD pour exécuter les tests et déployer l'application sur Render.

Exécution de l'API en local avec Python

Description : Cette étape vous permet de lancer l'API directement sur votre machine locale en utilisant Python. Elle est utile pour tester les fonctionnalités de l'API rapidement et sans avoir besoin de Docker ou d'un environnement complexe. Les développeurs peuvent exécuter python app.py pour démarrer l'API sur localhost:5000 et interagir avec celle-ci en envoyant des requêtes HTTP pour vérifier son bon fonctionnement.

Lancer l'application localement :
```
python app.py
```
L'application sera disponible à l'adresse http://127.0.0.1:5000.

Tester l'API avec une requête curl :

curl -X POST http://localhost:5000/predict \
-H "Content-Type: application/json" \
-d "{\"features\": [5.1, 3.5, 1.4, 0.2]}"

Vous recevrez une réponse JSON avec la classe prédite :

{
  "prediction": 0
}

Accéder à la documentation Swagger : Accédez à http://127.0.0.1:5000/apidocs/ pour voir la documentation complète de l'API générée automatiquement via Swagger.
Tests : Pour exécuter les tests unitaires :
```
pytest
```
Les tests se trouvent dans le répertoire tests/ et couvrent les fonctionnalités principales de l'API.

Note : Sur Windows, utilisez ^ pour les requêtes multi-lignes, tandis que sur Linux/macOS, utilisez \. Si vous rencontrez des erreurs, ajustez le format des requêtes en fonction de votre système d'exploitation.

Simulation de l'environnement de production avec Docker

Description : Cette étape simule un environnement de production localement en exécutant l'API dans un conteneur Docker. Cela permet de tester l'application dans un environnement isolé, avec toutes ses dépendances, comme ce sera le cas en production. Vous construisez l'image Docker de l'application, puis vous la lancez dans un conteneur sur localhost:5000, assurant ainsi que l'application est prête pour le déploiement.

Construire l'image Docker :
```
docker build -t iris-api .
```
Lancer le conteneur Docker :
```
docker run -p 5000:5000 iris-api
```
L'application sera disponible à http://127.0.0.1:5000.

Tester l'API avec une requête curl :

curl -X POST http://localhost:5000/predict \
-H "Content-Type: application/json" \
-d "{\"features\": [5.1, 3.5, 1.4, 0.2]}"

Accéder à la documentation Swagger : Accédez à http://127.0.0.1:5000/apidocs/ pour voir la documentation complète de l'API générée automatiquement via Swagger.
Tests : Pour exécuter les tests unitaires :
```
pytest
```

Automatisation du déploiement avec un pipeline CI/CD

Description : Cette étape est dédiée à l'automatisation complète du cycle de développement à travers un pipeline CI/CD (Continuous Integration/Continuous Deployment) utilisant GitHub Actions. Le pipeline automatise les tests unitaires, la construction de l'image Docker, et le déploiement sur Render en production. Chaque modification apportée au code déclenche le pipeline pour garantir que les mises à jour sont testées et déployées de manière fiable et sans intervention manuelle. C'est une étape cruciale pour assurer la qualité et la rapidité des déploiements en production.

Importance du CI/CD

Qu'est-ce que le CI/CD ?

Le CI/CD, ou Continuous Integration/Continuous Deployment, est une pratique de développement logiciel qui automatise les processus de test, d'intégration et de déploiement des applications. Cette approche permet d'intégrer les nouvelles modifications dans le code source de manière continue, de tester ces modifications automatiquement, et de déployer rapidement et de manière fiable les nouvelles versions de l'application.

Pourquoi est-il important ?

L'importance du CI/CD réside dans les bénéfices suivants :

Automatisation : Le CI/CD permet d'automatiser des processus fastidieux comme les tests et les déploiements. Cela réduit les erreurs humaines et garantit des processus fiables et reproductibles.
Rapidité : En automatisant les tests et les déploiements, les développeurs peuvent itérer plus rapidement et mettre à jour leurs applications plus fréquemment, avec des retours immédiats en cas de problèmes.
Qualité : Grâce à des tests automatisés exécutés à chaque modification du code, le CI/CD améliore la qualité du code en détectant rapidement les régressions ou les bugs.
Confiance : En s'appuyant sur des pipelines bien configurés, les développeurs peuvent déployer en production avec confiance, sachant que les tests ont été effectués et que les étapes de déploiement sont automatisées.

Relations entre GitHub Actions, Docker Hub et Render

Le CI/CD (Continuous Integration/Continuous Deployment) est essentiel pour automatiser tout le processus de développement. Ce projet est configuré avec un pipeline CI/CD dans le fichier .github/workflows/ci-cd.yml. Chaque fois qu'un développeur pousse une modification sur le dépôt GitHub, le pipeline CI/CD est déclenché via GitHub Actions, qui suit ces étapes :

Installation des dépendances : À chaque push sur la branche principale du dépôt GitHub, le pipeline commence par installer les dépendances définies dans requirements.txt.
Tests et validation : Le pipeline commence par exécuter les tests unitaires via pytest. Si les tests échouent, le processus s'arrête ici.
Construction de l'image Docker : Si les tests réussissent, une image Docker de l'API est automatiquement construite et envoyée vers Docker Hub.
Déploiement automatique sur Render : Une fois l'image Docker prête et validée, le déploiement est déclenché sur Render via un webhook. Render récupère l'image depuis Docker Hub et l'utilise pour déployer la nouvelle version de l'application en production.

🚨 Notez qu'il est important de désactiver l'option Auto-Deploy sur Render pour que le déploiement suive uniquement le workflow GitHub Actions et ne se déclenche qu'après validation complète du pipeline CI/CD. 🚨

Secrets dans CI/CD

Les secrets pour Docker Hub et Render doivent être ajoutés dans les secrets GitHub de votre dépôt. Pour ce faire :

Ajouter les secrets GitHub :
- DOCKER_USERNAME : Votre nom d'utilisateur Docker Hub.
- DOCKER_PASSWORD : Votre mot de passe Docker Hub.
- RENDER_DEPLOY_HOOK : URL du webhook Render pour déployer l'application.
Allez dans les paramètres de votre dépôt GitHub, puis dans la section Secrets and variables > Actions pour ajouter ces secrets.

Tester l'API en production

L'API de ce projet est déployée sur Render et est disponible à l'adresse suivante :

https://iris-api-7cbf.onrender.com

Tester l'API en production

Vous pouvez tester l'API en envoyant une requête POST à l'endpoint /predict :

curl -X POST https://iris-api-7cbf.onrender.com/predict \
-H "Content-Type: application/json" \
-d "{\"features\": [5.1, 3.5, 1.4, 0.2]}"

Vous recevrez une réponse JSON avec la classe prédite. Par exemple :

{
  "prediction": 0
}

Consulter la documentation de l'API

Vous pouvez également accéder à la documentation Swagger de l'API en production à l'adresse suivante :

https://iris-api-7cbf.onrender.com/apidocs/

Améliorations futures

Ajouter des tests supplémentaires pour améliorer la couverture.
Optimiser la gestion des erreurs pour plus de robustesse.
Implémenter un système de cache pour les prédictions.
Ajouter des fonctionnalités de monitoring et de logging pour la production.

Ce guide est conçu pour vous fournir un aperçu complet du projet, de l'installation à l'utilisation, en passant par les tests, le déploiement et l'importance du CI/CD dans ce projet.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Guide pour Déployer une API de Prédiction Iris avec un Pipeline CI/CD sur Render

Table des matières

Introduction et description du projet

Fonctionnalités

Prérequis

Installation

Structure du projet

Explication des fichiers principaux :

Exécution de l'API en local avec Python

Simulation de l'environnement de production avec Docker

Automatisation du déploiement avec un pipeline CI/CD

Importance du CI/CD

Qu'est-ce que le CI/CD ?

Pourquoi est-il important ?

Relations entre GitHub Actions, Docker Hub et Render

Secrets dans CI/CD

Tester l'API en production

Tester l'API en production

Consulter la documentation de l'API

Améliorations futures

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
.github/workflows		.github/workflows
models		models
swagger		swagger
tests		tests
utils		utils
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt
train_model.py		train_model.py

mnassrib/iris-api

Folders and files

Latest commit

History

Repository files navigation

Guide pour Déployer une API de Prédiction Iris avec un Pipeline CI/CD sur Render

Table des matières

Introduction et description du projet

Fonctionnalités

Prérequis

Installation

Structure du projet

Explication des fichiers principaux :

Exécution de l'API en local avec Python

Simulation de l'environnement de production avec Docker

Automatisation du déploiement avec un pipeline CI/CD

Importance du CI/CD

Qu'est-ce que le CI/CD ?

Pourquoi est-il important ?

Relations entre GitHub Actions, Docker Hub et Render

Secrets dans CI/CD

Tester l'API en production

Tester l'API en production

Consulter la documentation de l'API

Améliorations futures

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages