SLA IA Act : Service Level Agreements
📉 SLA Inadaptés = Risques Majeurs
67% des contrats IA utilisent des SLA conçus pour des logiciels traditionnels, sans métriques spécifiques à l’intelligence artificielle. Résultat : litiges, performances dégradées, et non-conformité IA Act.
Vous achetez un système IA ? Vous en vendez un ? Le Service Level Agreement (SLA) est le document qui définit ce que vous pouvez attendre — et ce que vous devez garantir.
Mais les SLA traditionnels (disponibilité 99.9%, temps de réponse < 500ms) ne suffisent plus pour l'IA. Comment mesurer la "performance" d'un modèle de machine learning ? Que faire quand la précision se dégrade ? Qui est responsable si l'IA dérive ?
Ce guide explore les SLA spécifiques à l’IA, les métriques à inclure, les pénalités à négocier, et le lien avec les exigences de l’IA Act pour les systèmes haut risque.
Par Loïc Gros-Flandre
Directeur de Modernee – Agence IA. Expert en contrats technologiques et conformité réglementaire.
📚 Ce que vous allez découvrir
- → Définition et spécificités des SLA IA
- → Métriques clés à inclure
- → Lien SLA et exigences IA Act
- → Pénalités et escalades
- → Templates et négociation
Infographie : Les 6 composantes d’un SLA IA complet
📋 Qu’est-ce Qu’un SLA IA ?
Photo par Campaign Creators sur Unsplash
Un Service Level Agreement (SLA) est un contrat définissant les engagements de qualité de service entre un fournisseur et un client. Pour l’IA, il doit aller au-delà des métriques IT classiques.
🔄 SLA Traditionnel vs SLA IA
| Aspect | SLA Traditionnel | SLA IA |
|---|---|---|
| Disponibilité | Uptime 99.9% | Uptime 99.9% + IA fonctionnelle |
| Performance | Latence, throughput | Latence + précision + qualité outputs |
| Dégradation | Panne binaire (marche/marche pas) | Dégradation progressive (dérive, drift) |
| Maintenance | Patches, updates | Ré-entraînement modèles, fine-tuning |
| Mesure | Automatique (monitoring) | Automatique + évaluation humaine |
⚠️ L’Erreur Classique
Un système IA peut avoir 100% d’uptime mais des prédictions de plus en plus mauvaises à cause de la dérive du modèle. Le SLA traditionnel ne détecte pas ce problème.
📊 Métriques Spécifiques à l’IA
Un SLA IA doit inclure des métriques que les SLA traditionnels ignorent :
- 🎯 Précision (Accuracy) : % de prédictions correctes
- 📈 F1-Score : Équilibre précision/rappel
- 📉 Dérive (Drift) : Dégradation des performances dans le temps
- ⚠️ Taux de faux positifs/négatifs : Critique pour le haut risque
- 🔄 Fraîcheur du modèle : Date du dernier ré-entraînement
- ✅ Couverture : % de cas gérés vs renvoyés à un humain
« Un SLA qui ne mesure que l’uptime pour un système IA, c’est comme mesurer la vitesse d’une voiture sans vérifier si elle va dans la bonne direction. »
— Architecte Solutions IA, ESN française
⚖️ SLA et Exigences de l’IA Act
Photo par Scott Graham sur Unsplash
L’IA Act n’impose pas directement de SLA contractuels. Mais ses exigences pour les systèmes haut risque se traduisent naturellement en engagements de service.
📋 Exigences IA Act → Clauses SLA
| Exigence IA Act | Article | Clause SLA Correspondante |
|---|---|---|
| Précision et robustesse | Art. 15 | Seuil de précision garanti (ex: 95%+) |
| Cybersécurité | Art. 15 | Disponibilité, protection données |
| Surveillance post-marché | Art. 72 | Monitoring, reporting, alertes |
| Logs et traçabilité | Art. 12 | Conservation logs, accès aux données |
| Mesures correctives | Art. 20 | Délai de correction, ré-entraînement |
💡 Synergie SLA / Conformité
Un bon SLA IA facilite la conformité IA Act. Les métriques surveillées dans le SLA (précision, dérive, logs) sont exactement celles requises par le règlement pour les systèmes haut risque.
📊 Niveaux de Service par Niveau de Risque
| Niveau Risque IA Act | Disponibilité | Précision | Dérive Max | Support |
|---|---|---|---|---|
| Haut risque | 99.95%+ | 95%+ | -2% / trimestre | 24/7, 1h réponse |
| Risque limité | 99.9% | 90%+ | -5% / trimestre | Heures ouvrées |
| Risque minimal | 99.5% | 85%+ | Best effort | Email / ticket |
🎯 Quiz : Maîtrisez-vous les SLA IA ?
📊 Les 10 Métriques Clés d’un SLA IA
Voici les métriques essentielles à inclure dans tout SLA pour un système d’intelligence artificielle.
1️⃣ Disponibilité (Uptime)
La métrique de base, mais avec une nuance pour l’IA : le système doit être disponible ET fonctionnel.
| Niveau | Uptime | Indisponibilité/an | Usage typique |
|---|---|---|---|
| Standard | 99.9% | 8h 45min | Applications non-critiques |
| Élevé | 99.95% | 4h 22min | Applications business |
| Critique | 99.99% | 52min | Santé, sécurité, finance |
| Ultra-critique | 99.999% | 5min | Systèmes vitaux |
2️⃣ Latence (Temps de Réponse)
- ⚡ P50 : Médiane (50% des requêtes plus rapides)
- 📊 P95 : 95% des requêtes (exclut les cas extrêmes)
- 🎯 P99 : 99% des requêtes (important pour UX)
Exemple : « Latence P95 < 200ms, P99 < 500ms"
3️⃣ Précision (Accuracy)
Le % de prédictions correctes. Attention : dépend fortement du cas d’usage et du dataset de validation.
⚠️ Piège à Éviter
Exiger « 95% de précision » sans définir le dataset de test est dangereux. Le fournisseur peut utiliser un dataset facile. Spécifiez : « 95% sur le dataset de production du client, mesuré mensuellement. »
4️⃣ F1-Score / AUC
Pour les problèmes de classification, le F1-Score équilibre précision et rappel. L’AUC (Area Under Curve) mesure la capacité de discrimination.
5️⃣ Dérive (Drift)
La dégradation des performances dans le temps. Définir :
- 📉 Seuil d’alerte : -2% de précision déclenche une investigation
- 🚨 Seuil critique : -5% déclenche un ré-entraînement obligatoire
- ⏱️ Délai de correction : Max 2 semaines après détection
6️⃣ Taux d’Erreur
- 🔴 Faux positifs : % de fausses alertes
- 🟡 Faux négatifs : % de cas ratés (souvent plus grave)
- ⚖️ Équilibre : Selon le coût de chaque type d’erreur
7️⃣ Throughput
Nombre de requêtes traitées par seconde/minute. Important pour les systèmes à fort volume.
8️⃣ Fraîcheur du Modèle
Date du dernier ré-entraînement. Pour certains domaines (finance, fraude), un modèle de plus de 3 mois peut être obsolète.
9️⃣ Couverture
% de cas traités automatiquement vs renvoyés à un humain. Un système qui renvoie 50% des cas à un humain n’est peut-être pas viable.
🔟 Temps de Rétablissement (RTO/RPO)
- ⏱️ RTO (Recovery Time Objective) : Délai max pour rétablir le service
- 💾 RPO (Recovery Point Objective) : Perte de données max acceptable
🤝 Négocier un SLA IA : Guide Pratique
Photo par Carlos Muza sur Unsplash
La négociation d’un SLA IA demande une préparation spécifique. Voici les étapes clés.
Définir Vos Besoins Réels
Quelle criticité ? Quel volume ? Quelle tolérance aux erreurs ? Un système de recommandation e-commerce n’a pas les mêmes exigences qu’un diagnostic médical.
Benchmarker l’Existant
Mesurez les performances actuelles (ou demandez au fournisseur ses benchmarks). Un SLA doit être réaliste par rapport à l’état de l’art.
Définir les Métriques Précisément
Pas de « haute disponibilité » ou « bonne précision ». Chiffrez tout : 99.95% uptime, 93% F1-score sur dataset X, latence P99 < 300ms.
Prévoir les Exclusions Légitimes
Maintenance planifiée, force majeure, faute du client. Mais refusez les exclusions trop larges (« comportement imprévisible de l’IA »).
Négocier les Pénalités
Crédits de service progressifs. Exemple : -10% si < 99.9%, -25% si < 99.5%, résiliation possible si < 99% pendant 2 mois consécutifs.
Planifier les Révisions
L’IA évolue vite. Prévoyez une révision du SLA tous les 6-12 mois pour ajuster les seuils et ajouter de nouvelles métriques.
« Le meilleur SLA est celui que les deux parties comprennent et considèrent comme équilibré. Un SLA trop agressif incite le fournisseur à tricher sur les mesures. »
— Directeur Achats IT, Groupe industriel
💰 Pénalités et Recours
Les pénalités doivent être suffisamment dissuasives pour motiver le fournisseur, mais réalistes pour rester applicables.
📊 Structure Typique de Pénalités
| Performance Atteinte | Crédit Service | Action |
|---|---|---|
| ≥ 99.95% | 0% | SLA respecté |
| 99.9% – 99.95% | -10% | Crédit mensuel |
| 99.5% – 99.9% | -25% | Crédit + plan d’action |
| 99% – 99.5% | -50% | Crédit + escalade direction |
| < 99% | -100% | Gratuit + droit de résiliation |
⚠️ Clauses Spécifiques IA
- 📉 Dérive non corrigée : Si précision < seuil pendant 30 jours sans action, pénalité automatique
- 🔄 Ré-entraînement tardif : Délai max pour mise à jour du modèle après détection de dérive
- 📊 Transparence métriques : Accès en temps réel aux dashboards de performance
- 🛡️ Incidents de sécurité : Notification sous 24h, rapport sous 72h
💡 Bonne Pratique
Prévoyez un plafond de pénalités (ex: max 100% de la redevance mensuelle). Cela protège le fournisseur tout en maintenant l’incitation à la qualité.
📋 Générateur de Clauses SLA IA
❓ Questions Fréquentes – SLA IA
Un SLA (Service Level Agreement) IA est un contrat définissant les engagements de performance d’un système d’intelligence artificielle : disponibilité, temps de réponse, précision des prédictions, et pénalités en cas de non-respect. Il diffère des SLA traditionnels par l’ajout de métriques spécifiques à l’IA comme la dérive ou le F1-score.
L’IA Act n’impose pas directement de SLA contractuels, mais exige des garanties de performance pour les systèmes haut risque : précision, robustesse, cybersécurité (Article 15). Ces exigences se traduisent naturellement en clauses SLA entre fournisseurs et clients.
Dépend de la criticité : 99.9% (8.7h indisponibilité/an) pour les systèmes non-critiques, 99.95% (4.4h/an) pour les systèmes importants, 99.99% (52min/an) pour les systèmes critiques (santé, sécurité). Pour les systèmes haut risque IA Act, visez au minimum 99.95%.
Métriques clés : disponibilité (uptime), latence (temps de réponse P95/P99), throughput (requêtes/seconde), précision (accuracy, F1-score), dérive (drift detection), et taux d’erreur (faux positifs/négatifs). Chaque métrique doit avoir un seuil cible et un seuil minimal acceptable.
Oui, c’est essentiel pour l’IA. La dérive (drift) est la dégradation progressive des performances d’un modèle. Le SLA doit inclure : monitoring de la dérive, seuils d’alerte (-2%), délai de ré-entraînement (max 2 semaines), et garanties de performance post-mise à jour.
Pénalités typiques : crédits de service (10-30% du montant mensuel), réduction tarifaire, droit de résiliation anticipée. Pour les systèmes critiques, prévoir des pénalités progressives : -10% si < 99.9%, -25% si < 99.5%, résiliation possible si < 99% pendant 2 mois.
Exclusions légitimes : maintenance planifiée (avec préavis), force majeure, faute du client (données invalides), cas d’usage non prévus. Attention aux exclusions abusives : « comportement imprévisible de l’IA » ou « évolution de l’environnement » sont trop vagues et à refuser.
Oui. L’IA générative (LLM, images) nécessite des métriques spécifiques : qualité des outputs (évaluations humaines ou automatiques), taux de refus (safety filters), cohérence, et absence de contenus problématiques. Les SLA traditionnels de disponibilité ne suffisent pas.
🎯 Conclusion : Des SLA à la Hauteur de l’IA
Les systèmes d’IA ne peuvent pas être couverts par des SLA conçus pour des logiciels traditionnels. La nature probabiliste de l’IA, sa dégradation progressive (dérive), et les exigences de l’IA Act imposent une approche contractuelle spécifique.
Un bon SLA IA combine métriques IT classiques (disponibilité, latence) et métriques spécifiques (précision, dérive, qualité des outputs). Il prévoit des pénalités proportionnées et des mécanismes de révision régulière.
✅ Ce Qu’il Faut Retenir
- SLA traditionnel insuffisant : L’IA a besoin de métriques spécifiques (précision, dérive)
- Lien IA Act : Les exigences haut risque se traduisent en clauses SLA
- Métriques clés : Uptime, latence, précision, F1-score, drift, couverture
- Pénalités progressives : Crédits de service, escalade, résiliation
- Révision régulière : L’IA évolue, le SLA aussi
Maîtrisez les Contrats IA
Formation complète SLA, contrats et IA Act
Obtenir ma certification → 500€