Versioning Modèles IA : Gestion Versions
🔄 Sans Versioning, Pas de Rollback
Votre modèle IA en production commence à discriminer. Vous devez revenir à la version précédente. Sans versioning, c’est impossible. L’AI Act exige cette traçabilité. Êtes-vous prêt ?
Le versioning des modèles IA n’est pas un luxe pour les grandes entreprises. C’est une obligation technique pour tout système IA à haut risque sous l’AI Act. Impossible de prouver la conformité sans historique complet des versions.
Le problème ? Les modèles ML ne sont pas du code. Un modèle de deep learning peut peser plusieurs gigaoctets. Les outils classiques (Git) ne suffisent pas. Il faut des solutions spécialisées : DVC, MLflow, Model Registry.
Ce guide vous montre comment implémenter un versioning robuste, des outils à choisir jusqu’au rollback en production, en passant par les bonnes pratiques de la validation modèles IA.
📚 Ce que vous allez apprendre
- → Pourquoi le versioning est obligatoire sous l’AI Act
- → Git vs Git LFS vs DVC : lequel choisir
- → Comment configurer un Model Registry
- → Les artefacts à versionner obligatoirement
- → Procédure de rollback en production
- → Intégration CI/CD pour le MLOps
- → Bonnes pratiques de nommage des versions
Infographie : Pipeline de versioning MLOps complet
🔄 Pourquoi le Versioning est Obligatoire sous l’AI Act
L’AI Act impose une traçabilité complète des systèmes IA à haut risque. Le versioning est la pierre angulaire de cette traçabilité.
Photo par Campaign Creators sur Unsplash
📜 Exigences AI Act (Annexe IV)
L’AI Act exige que la documentation technique inclue :
- 📋 Historique des versions — Toutes les versions du système
- 📋 Modifications documentées — Changements entre versions
- 📋 Traçabilité données-modèle — Lien entre données et version
- 📋 Capacité de rollback — Retour à une version antérieure
- 📋 Conservation 10 ans — Après mise sur le marché
🎯 Les 5 Raisons Business du Versioning
| Raison | Sans Versioning | Avec Versioning |
|---|---|---|
| Rollback | Impossible, ré-entraînement | 5 minutes max |
| Audit AI Act | Échec garanti | Documentation complète |
| Reproductibilité | Aléatoire | 100% garanti |
| Collaboration | Conflits, pertes | Travail parallèle |
| Debug | Difficile | Comparaison versions |
« Lors d’un audit, la première question est : montrez-moi l’historique des versions. Sans réponse claire, l’audit s’arrête là. »
— Lead MLOps, cabinet de conseil Big Four
🛠️ Git vs Git LFS vs DVC : Quel Outil Choisir ?
Le versioning ML n’est pas du versioning code classique. Les modèles peuvent peser plusieurs gigaoctets. Voici les options.
Photo par Scott Graham sur Unsplash
📊 Comparatif des Outils
| Critère | Git | Git LFS | DVC |
|---|---|---|---|
| Taille max fichier | ~100 Mo | ~5 Go | Illimité |
| Stockage | Repo Git | Serveur LFS | S3, GCS, Azure |
| Versioning données | ❌ | ⚠️ Limité | ✅ Natif |
| Pipeline ML | ❌ | ❌ | ✅ Oui |
| Courbe apprentissage | Facile | Facile | Moyenne |
| Coût | Gratuit | Payant (stockage) | Gratuit + stockage |
| Recommandé pour | Code | Modèles < 5 Go | MLOps complet |
🎯 Recommandation par Cas d’Usage
- 💻 Startup, modèles légers (<500 Mo) — Git LFS suffit
- 🏢 ETI, plusieurs modèles — DVC + MLflow
- 🏭 Grande entreprise, LLM — DVC + Model Registry dédié
- ☁️ Full cloud (AWS/GCP/Azure) — Services managés (SageMaker, Vertex AI)
💡 Notre Recommandation
Pour la plupart des équipes : Git (code) + DVC (données/modèles) + MLflow (tracking/registry). Cette stack est gratuite, open source, et couvre tous les besoins AI Act.
📦 DVC : Versioning Données et Modèles
DVC (Data Version Control) est l’outil de référence pour versionner les gros fichiers ML tout en gardant la compatibilité Git.
⚙️ Fonctionnement de DVC
DVC ajoute une couche au-dessus de Git :
- 1️⃣ Fichiers légers (.dvc) — Stockés dans Git, contiennent le hash
- 2️⃣ Fichiers volumineux — Stockés sur S3/GCS/Azure, référencés par hash
- 3️⃣ Synchronisation — `dvc push` / `dvc pull` comme Git
- 4️⃣ Pipelines — Définition des étapes d’entraînement
📝 Exemple de Configuration DVC
📁 Structure Projet avec DVC
my-ml-project/
├── .git/ # Repo Git
├── .dvc/ # Config DVC
│ └── config # Stockage distant
├── data/
│ ├── train.csv # Données (ignorées par Git)
│ └── train.csv.dvc # Métadonnées (versionnées)
├── models/
│ ├── model.pkl # Modèle (ignoré par Git)
│ └── model.pkl.dvc # Métadonnées (versionnées)
├── src/
│ └── train.py # Code (versionné par Git)
├── dvc.yaml # Pipeline DVC
└── dvc.lock # Versions verrouillées
🔧 Commandes DVC Essentielles
| Commande | Description |
|---|---|
dvc init |
Initialiser DVC dans un repo Git |
dvc add data/train.csv |
Ajouter un fichier au tracking DVC |
dvc push |
Pousser les fichiers vers le stockage distant |
dvc pull |
Récupérer les fichiers depuis le stockage distant |
dvc checkout |
Revenir à une version spécifique |
dvc repro |
Reproduire le pipeline d’entraînement |
📚 Model Registry : Catalogue Centralisé
Le Model Registry est le catalogue centralisé de tous vos modèles. Il complète DVC en ajoutant la gestion du lifecycle.
Photo par Carlos Muza sur Unsplash
📋 Fonctionnalités d’un Model Registry
- 📦 Stockage centralisé — Tous les modèles au même endroit
- 🏷️ Versioning sémantique — v1.0.0, v1.1.0, v2.0.0
- 📊 Métriques attachées — Accuracy, F1, latence
- 🔄 Statuts lifecycle — Staging, Production, Archived
- 📝 Métadonnées — Auteur, date, description, Model Card
- 🔗 Lineage — Lien vers données et code d’entraînement
🏆 Comparatif Model Registries
| Solution | Type | Points Forts | Limites |
|---|---|---|---|
| MLflow Registry | Open source | Gratuit, populaire, intégré | Scaling manuel |
| Weights & Biases | SaaS | UI excellent, collaboration | Payant, vendor lock-in |
| AWS SageMaker | Cloud | Intégration AWS native | AWS only |
| Azure ML | Cloud | Intégration Azure native | Azure only |
| Vertex AI (GCP) | Cloud | Intégration GCP native | GCP only |
⚠️ Éviter le Vendor Lock-in
Les solutions cloud managées sont pratiques mais créent une dépendance. Pour l’AI Act, privilégiez des solutions portables (MLflow) qui permettent d’exporter facilement vos modèles et métadonnées.
📊 Évaluateur Maturité Versioning
⏪ Procédure de Rollback en Production
Le rollback est la capacité à revenir à une version précédente du modèle. C’est l’assurance-vie de votre système IA.
🚨 Scénarios Nécessitant un Rollback
- ⚠️ Dérive de performance — Accuracy en chute
- ⚠️ Biais détecté — Discrimination en production
- ⚠️ Bug critique — Prédictions erronées
- ⚠️ Latence dégradée — Temps de réponse trop lent
- ⚠️ Incident sécurité — Vulnérabilité découverte
📋 Procédure de Rollback (4 Étapes)
Identifier la Version Cible
Dans le Model Registry, identifiez la dernière version stable. Vérifiez ses métriques et son historique de production.
Valider la Version
Exécutez les tests de validation sur la version cible. Assurez-vous qu’elle passe tous les critères de qualité.
Déployer la Version
Utilisez votre pipeline CI/CD pour redéployer la version stable. Rollback canary si possible (5% puis 100%).
Documenter l’Incident
Créez un rapport d’incident : cause, impact, actions. C’est obligatoire pour l’AI Act (traçabilité des modifications).
⚠️ Temps de Rollback Objectif
Un bon versioning permet un rollback en moins de 5 minutes. Si votre rollback prend des heures, votre infrastructure n’est pas prête pour l’AI Act.
📦 Quels Artefacts Versionner ?
Un modèle seul ne suffit pas. Pour garantir la reproductibilité et la conformité, vous devez versionner un ensemble complet d’artefacts.
✅ Artefacts Obligatoires
| Artefact | Format | Outil Recommandé |
|---|---|---|
| Poids du modèle | .pkl, .h5, .pt, .onnx | DVC, Model Registry |
| Configuration | config.yaml, params.json | Git |
| Hyperparamètres | JSON, YAML | MLflow Tracking |
| Code entraînement | .py, notebooks | Git |
| Référence données | Hash, version DVC | DVC |
| Métriques | JSON, metrics.yaml | MLflow Tracking |
| Dépendances | requirements.txt, Pipfile | Git |
| Model Card | Markdown, JSON | Git + Registry |
🏷️ Convention de Nommage (Semantic Versioning)
Adoptez le Semantic Versioning pour vos modèles :
- 🔢 MAJOR.MINOR.PATCH — Ex: v2.1.3
- 📈 MAJOR — Changement d’architecture, incompatible
- ➕ MINOR — Nouvelles features, rétrocompatible
- 🔧 PATCH — Corrections, optimisations
💡 Exemple de Nommage
fraud-detector-v2.3.1-2024-12-19-abc123
Nom du modèle + version + date + hash commit Git
❓ Questions Fréquentes – Versioning Modèles IA
Le versioning des modèles IA est la pratique de suivre et stocker chaque version d’un modèle ML avec ses artefacts associés : poids, hyperparamètres, données d’entraînement, métriques. Il permet le rollback, la comparaison, et la traçabilité exigée par l’AI Act.
L’AI Act exige la traçabilité complète des systèmes IA à haut risque. Sans versioning : impossible de documenter l’évolution, d’assurer le rollback, de prouver la conformité lors des audits, ou de reproduire les résultats. C’est une exigence technique fondamentale.
Git = code source. Git LFS = fichiers volumineux jusqu’à ~5 Go. DVC = solution complète ML (données, modèles, pipelines) avec stockage cloud. Recommandation : Git (code) + DVC (données/modèles) + MLflow (tracking).
Un catalogue centralisé des modèles ML de l’organisation. Il stocke : versions, métriques, métadonnées, statut (staging/production/archived), historique. Exemples : MLflow Registry, Weights & Biases, AWS SageMaker Model Registry.
4 étapes : 1) Identifier la version stable dans le registry, 2) Valider qu’elle passe les tests, 3) Redéployer via CI/CD, 4) Documenter l’incident. Objectif : rollback en moins de 5 minutes.
8 artefacts essentiels : poids du modèle, configuration, hyperparamètres, code d’entraînement, référence aux données, métriques, dépendances (requirements.txt), et Model Card. Le tout avec convention de nommage sémantique.
L’AI Act impose 10 ans de conservation après mise sur le marché. En pratique : toutes les versions production pendant 10 ans, versions staging pendant 2 ans minimum. Le stockage cloud rend cette conservation économique.
OUI, même pour les modèles tiers (OpenAI, Anthropic). Versionnez : version API utilisée, prompts système, paramètres (température, tokens), résultats de validation. Si le fournisseur change le modèle, vous devez tracer l’impact.
✅ Conclusion : Versioning = Fondation MLOps
Le versioning des modèles n’est pas une option nice-to-have. C’est la fondation technique de toute démarche MLOps et de conformité AI Act.
🎯 Les 3 Points à Retenir
- 🔄 DVC + MLflow — Stack recommandée : gratuit, open source, complet
- ⏪ Rollback < 5 min — Objectif de temps pour un bon versioning
- 📦 8 artefacts — Modèle + config + données + métriques + doc
Mettez en place votre versioning avant l’entrée en vigueur de l’AI Act.
🎓 Maîtrisez le MLOps pour l’AI Act
La formation Article 4 inclut les bonnes pratiques de versioning, documentation et traçabilité des systèmes IA.
Formation Certifiante → 500€✅ Certification Article 4 • ✅ MLOps inclus • ✅ Finançable OPCO
📚 Sources et Outils
- DVC — Documentation officielle • Data Version Control
- MLflow Model Registry • Documentation officielle
- AI Act — Annexe IV (Documentation technique) • Exigences traçabilité