Traçabilité IA Act : Décisions et Données
🔍 La Boîte Noire Interdite
L’AI Act interdit les systèmes IA opaques.
Chaque décision doit être traçable. Chaque modification horodatée.
Sans logs = Sans preuve = Sans défense.
L’Article 12 de l’AI Act impose aux systèmes haut risque une traçabilité complète. Vous devez pouvoir reconstituer, a posteriori, comment chaque décision a été prise, avec quelles données, par quelle version du modèle.
En cas de litige ou de contrôle, vos logs sont votre seule preuve. Si vous ne pouvez pas démontrer le fonctionnement de votre système IA à un instant T, vous êtes présumé non conforme.
Dans ce guide, découvrez les 5 dimensions de la traçabilité, les exigences techniques, et comment implémenter un système de logs conforme à l’AI Act.
📋 Ce que vous allez maîtriser
- → Les 5 dimensions de la traçabilité IA
- → Comment logger les décisions IA
- → Versioning du modèle et changelog
- → Durées de conservation obligatoires
- → Outils et architecture technique
Infographie : Les 5 dimensions de la traçabilité IA selon l’Article 12 de l’AI Act
🔍 Les 5 Dimensions de la Traçabilité IA
L’Article 12 de l’AI Act exige que les systèmes haut risque soient conçus pour permettre l’enregistrement automatique des événements (logs). Voici les 5 dimensions à couvrir.
Photo par Campaign Creators sur Unsplash
1️⃣ Traçabilité des Décisions
Chaque décision prise par votre système IA doit être loggée :
- ⏰ Horodatage : Date et heure précises (UTC recommandé)
- 🔢 Identifiant unique : ID de la décision pour référence
- 📥 Inputs : Données d’entrée (ou hash si volumineuses)
- 📤 Output : Décision/prédiction/recommandation
- 📊 Score de confiance : Niveau de certitude du modèle
- 💡 Explicabilité : Facteurs ayant influencé la décision
⚠️ Granularité selon le Risque
Décisions critiques (crédit, RH, santé) : Logger 100% des décisions avec tous les détails.
Décisions courantes : Échantillonnage possible mais toujours traçable sur demande.
2️⃣ Traçabilité des Données
Le data lineage complet de vos données :
- 🌐 Origine : D’où viennent les données (sources, collecte)
- 🔄 Transformations : Nettoyage, enrichissement, feature engineering
- 📅 Dates : Quand les données ont été collectées/traitées
- ✅ Qualité : Indicateurs de qualité des données
- 🔐 Consentement : Base légale si données personnelles
3️⃣ Traçabilité du Modèle
Le versioning complet de votre modèle IA :
- 🔢 Version : Numérotation sémantique (MAJOR.MINOR.PATCH)
- ⚙️ Hyperparamètres : Configuration utilisée
- 📊 Métriques : Performance sur le jeu de test
- 📅 Date de déploiement : Quand cette version est entrée en production
- 📝 Changelog : Ce qui a changé par rapport à la version précédente
4️⃣ Traçabilité des Modifications
L’historique complet des changements :
- 📋 Changelog : Description de chaque modification
- 👤 Auteur : Qui a effectué le changement
- 📅 Date : Quand le changement a été fait
- ❓ Justification : Pourquoi ce changement
- ✅ Validation : Tests effectués avant déploiement
5️⃣ Traçabilité des Accès
La journalisation des accès au système :
- 👤 Identité : Qui a accédé (utilisateur, service, API)
- ⏰ Moment : Horodatage précis
- 🎯 Action : Ce qui a été fait (lecture, modification, export)
- 📍 Contexte : IP, application cliente, géolocalisation
- ✅ Résultat : Succès ou échec de l’opération
« Sans traçabilité, votre système IA est une boîte noire. En cas de litige, vous ne pouvez pas prouver que la décision était justifiée. »
— Architecte Data, Cabinet de conseil spécialisé AI Act
🔍 Quiz : Votre Traçabilité est-elle Conforme ?
Évaluez la maturité de votre système de logs
⚙️ Exigences Techniques de Traçabilité
Photo par Scott Graham sur Unsplash
L’AI Act impose des exigences techniques précises pour que la traçabilité soit valide en cas d’audit.
📅 Durées de Conservation
| Type de Log | Durée Minimum | Recommandation |
|---|---|---|
| Logs opérationnels (décisions) | 6 mois | 2 ans (période chaude) |
| Logs d’audit (accès, modifications) | 5 ans | 7 ans |
| Documentation technique | 10 ans après arrêt | Vie du système + 10 ans |
| Versions du modèle | 10 ans après arrêt | Archivage permanent |
| Systèmes haut risque (santé, justice) | 30 ans | Permanent |
🔒 Intégrité des Logs
Les logs doivent être infalsifiables. Techniques recommandées :
- 📝 WORM : Write Once Read Many (stockage non modifiable)
- 🔐 Hashing : Empreinte cryptographique de chaque log
- ✍️ Signature : Signature électronique horodatée
- ⛓️ Blockchain : Chaîne de preuves immuable (optionnel)
- 🏛️ Tiers de confiance : Archivage certifié (ex: Arkhineo)
❌ Ce qui Invalide vos Logs
- ❌ Logs modifiables a posteriori
- ❌ Pas d’horodatage ou horodatage local
- ❌ Logs stockés uniquement chez un fournisseur sans contrat
- ❌ Absence de backup ou backup non testé
- ❌ Logs en clair contenant des données sensibles
📊 Format et Structure des Logs
Exemple de structure de log pour une décision IA :
{
"timestamp": "2025-12-19T14:32:17.892Z",
"decision_id": "DEC-2025-12-19-00042891",
"model_version": "credit-score-v2.3.1",
"input_hash": "sha256:a8f2d9e1b7c4...",
"output": {
"decision": "APPROVED",
"confidence": 0.87,
"amount_approved": 15000
},
"explanation": {
"top_factors": ["income_stability", "credit_history", "employment_duration"],
"risk_score": 23
},
"subject_id": "pseudonymized:USR-8a7f2e",
"operator_id": "system:auto-decision",
"context": {
"channel": "mobile_app",
"session_id": "sess-abc123"
}
}
🔧 Outils et Solutions
| Catégorie | Outils | Usage |
|---|---|---|
| MLOps / Versioning | MLflow, DVC, Weights & Biases | Versioning modèles, expériences |
| Data Lineage | Apache Atlas, OpenLineage, Collibra | Traçabilité des données |
| Logging centralisé | ELK Stack, Splunk, Datadog | Collecte et analyse des logs |
| Archivage sécurisé | AWS S3 Glacier, Arkhineo, Docaposte | Conservation longue durée |
| Explicabilité | SHAP, LIME, InterpretML | Facteurs explicatifs des décisions |
« La traçabilité n’est pas un add-on qu’on implémente après coup. Elle doit être pensée dès la conception du système. C’est du by-design, pas du retrofit. »
— Data Engineer Senior, Scale-up IA française
🛠️ Implémenter la Traçabilité en 6 Étapes
Photo par Carlos Muza sur Unsplash
Suivez cette méthodologie pour mettre en place un système de traçabilité conforme à l’AI Act.
Auditer l’Existant
Actions : Inventorier tous les logs existants, identifier les lacunes par rapport aux 5 dimensions, évaluer la qualité et l’intégrité actuelle.
Livrable : Rapport d’audit avec gap analysis.
Durée : 1-2 semaines.
Définir la Stratégie de Logging
Décisions : Quoi tracer (exhaustif ou échantillonné), à quelle granularité, quelle rétention, quel format standardisé.
Livrable : Politique de logging documentée.
Durée : 1 semaine.
Déployer l’Infrastructure
Actions : Mettre en place le système de collecte (agents, APIs), le stockage (hot/warm/cold), les mécanismes d’intégrité.
Livrable : Infrastructure opérationnelle.
Durée : 2-4 semaines.
Instrumenter les Systèmes IA
Actions : Intégrer le logging dans le code des modèles IA, ajouter l’explicabilité (SHAP), configurer le versioning MLflow.
Livrable : Systèmes IA instrumentés.
Durée : 2-3 semaines par système.
Sécuriser et Archiver
Actions : Implémenter le hashing, configurer l’archivage WORM, mettre en place les backups, tester la restauration.
Livrable : Système sécurisé et testé.
Durée : 1-2 semaines.
Documenter et Former
Actions : Rédiger la documentation technique, former les équipes à l’utilisation et à l’audit des logs.
Livrable : Documentation complète + équipes formées.
Durée : 1 semaine.
💡 Astuce : Commencez par le Plus Critique
Priorisez les systèmes IA haut risque (crédit, RH, santé).
Pour les autres, une traçabilité allégée peut suffire initialement.
📊 Simulateur Volume de Logs IA
❓ Questions Fréquentes – Traçabilité IA
La traçabilité IA est l’obligation de conserver des logs permettant de reconstituer le fonctionnement du système : chaque décision prise, les données utilisées, les modifications apportées, les accès effectués. L’objectif est de pouvoir auditer le système a posteriori.
L’AI Act exige une conservation proportionnée. En pratique : 6 mois minimum pour les logs opérationnels, 10 ans pour la documentation système, vie du système + 10 ans pour les systèmes haut risque. Certains secteurs (santé, finance) ont des exigences supplémentaires.
5 dimensions à tracer : les décisions IA (inputs, outputs, confiance), les données utilisées (origine, transformations), le modèle (version, paramètres), les modifications (changelog), et les accès (qui a fait quoi). Chaque événement doit être horodaté.
Pour chaque décision, logger : horodatage, identifiant unique, données d’entrée (ou hash), sortie du modèle, score de confiance, version du modèle, identifiant utilisateur (pseudonymisé), et si possible facteurs explicatifs (SHAP, LIME).
Oui, l’intégrité des logs est essentielle. Utilisez des techniques comme le WORM (Write Once Read Many), le hashing cryptographique, la signature électronique, ou des solutions blockchain pour garantir que les logs ne peuvent pas être modifiés a posteriori.
Jusqu’à 7,5 millions d’euros ou 1,5% du CA mondial. Mais surtout, sans traçabilité, vous ne pouvez pas prouver votre conformité sur les autres obligations, ce qui aggrave toute autre infraction.
Adoptez un versioning sémantique (MAJOR.MINOR.PATCH). Tracez pour chaque version : date, auteur, données d’entraînement, hyperparamètres, métriques, raison du changement, tests de validation. Utilisez des outils comme MLflow, DVC, ou Weights & Biases.
Oui. Si vous utilisez une IA en SaaS, exigez contractuellement l’accès aux logs de décision vous concernant. Vérifiez les capacités d’export. Si le fournisseur ne peut pas fournir de logs, documentez cette limite et évaluez le risque.
Stratégies : sampling intelligent (100% des décisions critiques, échantillon des autres), compression des données anciennes, archivage à froid après période chaude, agrégation des logs similaires. Un système haut risque peut générer plusieurs Go de logs par jour.
Équilibre délicat entre traçabilité AI Act et minimisation RGPD. Recommandation : logger des identifiants pseudonymisés plutôt que des données directement identifiantes. Permettre la reconstitution si nécessaire (audit) tout en protégeant la vie privée par défaut.
🎯 Conclusion : La Traçabilité, Votre Meilleure Défense
La traçabilité n’est pas une contrainte technique. C’est votre meilleure défense en cas de litige, de plainte, ou de contrôle.
Un système IA sans logs est une boîte noire. En cas de décision contestée, vous ne pouvez pas prouver qu’elle était justifiée. Vous êtes présumé non conforme.
- 1️⃣ 5 dimensions — Décisions, données, modèle, modifications, accès
- 2️⃣ Logs infalsifiables — WORM, hashing, signature électronique
- 3️⃣ 10 ans de conservation — Minimum pour systèmes haut risque
La deadline approche. Implémentez la traçabilité maintenant.
Formation Traçabilité et Conformité AI Act
Apprenez à implémenter un système de traçabilité conforme aux exigences de l’Article 12. Architecture, outils, bonnes pratiques.
Me former à la traçabilité → 500€🔍 5 dimensions • 📊 Outils MLOps • ✅ Templates inclus
📚 Sources Officielles Citées
- Règlement (UE) 2024/1689 – AI Act • Article 12 (Enregistrement)
- Commission européenne – AI Office • Guidelines traçabilité
- ENISA – Sécurité des systèmes IA • Recommandations logging