Pourcentage de déploiements production causant failure nécessitant remediation.
Change Failure Rate (CFR) est l'une des 4 DORA metrics : le pourcentage de déploiements production qui causent un incident, nécessitent un rollback, un hotfix, ou autre forme de remediation. Indicateur clé de stability et qualité du processus delivery.
Tiers DORA :
- Elite : 0-15%
- High : 16-30%
- Medium : 16-30% (DORA 2023 merged Medium et High)
- Low : 46-60%
Définition de "failure" : varie selon contexte mais typiquement (1) rollback nécessaire ; (2) hotfix dans 24h ; (3) incident SEV1/SEV2 attribué au deploy ; (4) feature flag kill switch utilisé ; (5) significant performance regression. Pas inclus : bugs cosmétiques mineurs sans user impact significant.
Reducing CFR :
(1) Smaller deployments (less surface area per change → less risk).
(2) Comprehensive automated testing (unit, integration, E2E, contract, performance).
(3) Canary deployments (catch issues with limited blast radius).
(4) Feature flags (kill switch).
(5) Code review culture (catch defects early).
(6) Better observability (catch regression fast).
(7) Chaos engineering (test failure scenarios proactively).
(8) Pre-production environment fidelity (staging mirrors prod).
(9) Database migration safety (expand-contract).
(10) Post-incident reviews driving systemic improvements.
Mesurer : count(failed deployments) / count(total deployments) over period. Important : ne pas confondre avec change FAILURE per deploy (= un seul deploy = 0% or 100%) — c'est un rate sur fenêtre. Tools : Jellyfish, Sleuth, LinearB, Swarmia, custom dashboards depuis incident management + deployment data.
200+ certifications, 400 000+ questions, examens blancs chronométrés.
Voir le catalogue →