Accueil · Guides de révision · DA0-001

Guide complet DA0-001 — CompTIA

CompTIA Data+ · Programme, plan de révision, ressources, examen blanc gratuit.

TL;DR — Le guide en 1 minute

La certification CompTIA Data+ (DA0-001) valide les competences fondamentales en analyse de donnees : extraction, manipulation, visualisation et gouvernance. Destinee aux analystes juniors, data analysts en reconversion et professionnels metiers manipulant des donnees, elle se passe en QCM de 90 minutes (90 questions max). Aucun prerequis formel, mais 18-24 mois d'experience recommandes. Debouches principaux : Data Analyst, Business Analyst, Reporting Analyst, Junior Data Scientist. Certification editeur-neutre reconnue mondialement, ideale pour structurer ses connaissances avant Azure DP-203 ou Google Data Analytics.

Pourquoi passer la certification DA0-001 ?

En 2026, la data reste le moteur principal de la transformation numerique des entreprises europeennes. Selon LinkedIn Workforce Report 2026, les postes d'analystes de donnees figurent dans le top 5 des metiers en tension, avec une croissance de +23% sur 12 mois en France. La certification CompTIA Data+ se distingue par son approche editeur-neutre : contrairement aux certifications Microsoft, Google ou AWS, elle couvre les concepts transversaux (statistiques descriptives, qualite des donnees, RGPD, ETL, visualisation) sans s'enfermer dans un ecosysteme proprietaire. Pour un profil junior ou en reconversion, c'est un excellent moyen de prouver une maitrise solide des fondamentaux avant de specialiser son CV sur Power BI, Tableau ou Python. Le ROI est rapide : l'investissement total (formation + examen) tourne autour de 600-900 EUR, pour une revalorisation salariale moyenne de 4000 a 7000 EUR brut annuel selon les etudes Hays et Robert Half 2026. Enfin, Data+ est de plus en plus exigee dans les appels d'offres publics europeens et reconnue par le DoD americain (directive 8140), ce qui ouvre des opportunites a l'international.

Caractéristiques de l'examen

Format QCM et questions basees performance, 90 questions max
Duree 90 minutes
Score requis 675 / 900 (environ 75%)
Prix officiel 275 EUR HT (voucher CompTIA Store)
Langues Anglais (francais non disponible officiellement)
Validite 3 ans (renouvelable via CEUs)
Prerequis Aucun officiel ; 18-24 mois d'experience en reporting recommandes

Programme détaillé par domaine

Domain 1 : Data Concepts and Environments 15%

Objectifs
Ce domaine pose les bases conceptuelles : comprendre les schemas de donnees, identifier les differents types de bases (relationnelles, NoSQL, data warehouse, data lake, data mart) et savoir choisir l'environnement adapte a un cas d'usage. Le candidat doit maitriser le vocabulaire : OLTP vs OLAP, structured vs unstructured vs semi-structured, schema en etoile vs flocon. L'examen teste aussi la comprehension des architectures hybrides cloud / on-premise et le positionnement des outils ETL/ELT dans la chaine de valeur.
Concepts clés
Schemas star et snowflake, normalisation (1NF, 2NF, 3NF), denormalisation pour l'analytique, dimensions et tables de faits (modele de Kimball), SCD types 1/2/3, data warehouse vs data lake vs lakehouse. Comprendre les formats : CSV, JSON, XML, Parquet, Avro. Distinguer donnees structurees (SQL), semi-structurees (logs JSON) et non structurees (images, PDF). Bien connaitre les concepts de cardinalite, integrite referentielle, cles primaires/etrangeres. La difference OLTP (transactionnel, normalisation forte) vs OLAP (analytique, agregation) revient frequemment a l'examen.
Services / outils
Bases relationnelles : MySQL, PostgreSQL, SQL Server, Oracle. NoSQL : MongoDB, Cassandra, DynamoDB. Data warehouses cloud : Snowflake, BigQuery, Redshift, Synapse. Outils ETL : Talend, Informatica, SSIS, Azure Data Factory.
Temps estimé
12h

Domain 2 : Data Mining 25%

Objectifs
Le plus gros domaine pondere : il couvre l'extraction, le nettoyage et la transformation des donnees. Le candidat doit savoir identifier les sources, evaluer leur qualite, gerer les valeurs manquantes, les doublons, les outliers, et appliquer des transformations adaptees. Comprehension des concepts ETL/ELT, parsing, validation, profiling. L'examen evalue la capacite a choisir la bonne methode de nettoyage selon le contexte metier et a documenter les transformations effectuees (data lineage).
Concepts clés
Data profiling, data wrangling, imputation (moyenne, mediane, KNN), detection d'outliers (IQR, Z-score, ecart-type), deduplication, normalisation (min-max, Z-score), standardisation. Methodes d'echantillonnage : aleatoire simple, stratifie, systematique, par grappes. Concepts de biais d'echantillonnage. Operations SQL essentielles : JOIN (inner, left, right, full), UNION, GROUP BY, HAVING, sous-requetes, CTE, fonctions fenetres (ROW_NUMBER, RANK). Connaitre les regex de base pour le parsing de chaines.
Services / outils
SQL (standard ANSI), Python pandas, R dplyr, OpenRefine pour le nettoyage interactif, Trifacta/Dataprep, Apache Spark pour le big data. Outils de profiling : Great Expectations, dbt tests.
Temps estimé
20h

Domain 3 : Data Analysis 23%

Objectifs
Ce domaine couvre les techniques statistiques et analytiques. Le candidat doit comprendre les statistiques descriptives (moyenne, mediane, mode, variance, ecart-type), inferentielles (tests d'hypotheses, intervalles de confiance, p-value) et savoir choisir la methode d'analyse adaptee : descriptive, diagnostique, predictive ou prescriptive. L'examen evalue aussi la comprehension des bases du machine learning supervise et non supervise.
Concepts clés
Distributions (normale, uniforme, Poisson, binomiale), theoreme central limite, correlation vs causalite, coefficients de Pearson et Spearman, regression lineaire et logistique, clustering (K-means, hierarchique), classification, arbres de decision. Tests statistiques : t-test, chi-deux, ANOVA. Concepts d'overfitting, underfitting, train/test split, validation croisee. Analyse de cohortes, analyse de variance, A/B testing. Connaitre la difference entre variables qualitatives (nominales, ordinales) et quantitatives (discretes, continues).
Services / outils
Excel (tableaux croises dynamiques, Solver), Python (scikit-learn, statsmodels, scipy), R (caret, ggplot2), SPSS, SAS, Jupyter Notebook.
Temps estimé
18h

Domain 4 : Visualization 23%

Objectifs
Ce domaine teste la capacite a communiquer les resultats via des dashboards et rapports efficaces. Le candidat doit savoir choisir le bon type de graphique selon les donnees et l'audience, appliquer les principes du design (theorie des couleurs, accessibilite, hierarchie visuelle), structurer un storytelling data-driven et eviter les visualisations trompeuses. Comprehension des notions de KPI, OKR, et reporting operationnel vs strategique.
Concepts clés
Types de graphiques : barres, lignes, scatter plot, heatmap, treemap, sankey, boxplot, histogramme. Quand utiliser quoi (regle de Cleveland-McGill). Principes de Tufte : data-ink ratio, chartjunk. Accessibilite WCAG, palettes daltoniens-friendly (viridis). Filtres, drill-down, drill-through, parametres dynamiques. Storytelling data : pyramide de Minto, contexte-conflit-resolution. Dashboards operationnels (temps reel) vs analytiques (exploration) vs strategiques (KPIs CODIR).
Services / outils
Tableau, Microsoft Power BI, Qlik Sense, Looker, Google Data Studio, Excel, matplotlib/seaborn/plotly (Python), ggplot2 (R).
Temps estimé
15h

Domain 5 : Data Governance, Quality, and Controls 14%

Objectifs
Domaine transversal couvrant la gouvernance, la qualite et la conformite. Le candidat doit maitriser les concepts de Master Data Management (MDM), data stewardship, data catalog, et les reglementations majeures : RGPD en Europe, HIPAA, SOX, PCI-DSS. Comprehension des roles (Chief Data Officer, Data Steward, Data Owner) et des controles : chiffrement, masquage, anonymisation, pseudonymisation, audit trails.
Concepts clés
Dimensions de la qualite des donnees : exactitude, completude, coherence, actualite, unicite, validite. MDM, data lineage, metadata management. RGPD : consentement, droit a l'oubli, DPO, registre des traitements, DPIA. Anonymisation vs pseudonymisation (difference juridique cruciale). Classification des donnees : publique, interne, confidentielle, restreinte. Politiques de retention, RACI. Concepts de data mesh et data fabric en emergence en 2026.
Services / outils
Collibra, Alation, Informatica Axon, Microsoft Purview, Apache Atlas. Outils de masquage : Delphix, IBM InfoSphere Optim.
Temps estimé
10h

Plan de révision hebdomadaire

Semaine 1 - Fondations : telecharger les exam objectives officiels (PDF CompTIA), lire le Domain 1 entier, regarder la serie Professor Messer sur YouTube (chapitres concepts et environnements). Installer PostgreSQL en local et creer une base d'exemple Northwind. Objectif : 10h de travail. Semaine 2 - Data Mining et SQL : pratiquer intensivement SQL sur HackerRank, LeetCode (section Database) et SQLZoo. Realiser 50 requetes minimum couvrant JOIN, GROUP BY, sous-requetes, fenetres. Lire le chapitre Data Mining du livre officiel CompTIA Data+ Study Guide (Sybex). Objectif : 15h. Semaine 3 - Statistiques et analyse : reviser les statistiques descriptives et inferentielles, suivre le cours Khan Academy Statistics. Realiser un mini-projet d'analyse exploratoire en Python (pandas + matplotlib) sur un dataset Kaggle. Objectif : 15h. Semaine 4 - Visualisation : construire 3 dashboards differents sur Power BI Desktop (gratuit) avec des datasets publics (data.gouv.fr). Travailler le storytelling. Lire Storytelling with Data de Cole Knaflic. Objectif : 12h. Semaine 5 - Gouvernance et RGPD : reviser le RGPD via le site CNIL, comprendre les roles et controles. Faire un premier examen blanc complet (CertMaster Practice ou MeasureUp). Identifier les domaines faibles. Objectif : 10h. Semaine 6 - Revision finale : refaire 3 examens blancs minimum, viser >80% systematiquement avant de prendre rendez-vous chez Pearson VUE. Reviser les flashcards (Anki deck CompTIA Data+). Repos la veille de l'examen. Objectif : 8h.

Besoin d'un planning sur mesure ? 30 jours · 60 jours · 90 jours

Ressources recommandées

Documentation officielle CompTIA Data+

Page officielle avec exam objectives PDF, sample questions gratuites et acces au CertMaster Learn payant.

CompTIA Data+ Study Guide (Sybex/Wiley)

Livre de reference de Mike Chapple, couvre 100% des objectifs avec exercices et examen blanc inclus.

Labs pratiques Kaggle + Mode Analytics SQL Tutorial

Tutoriel SQL gratuit progressif et datasets reels pour pratiquer l'analyse exploratoire et la visualisation.

Communaute Reddit r/CompTIA

Retours d'experience, conseils de candidats recents, partage de ressources et FAQ animee par la communaute.

5 erreurs classiques à éviter

  • Erreur 1 : Negliger SQL au profit de la theorie. Beaucoup de candidats survolent les requetes complexes. Solution : pratiquer 1h de SQL par jour minimum sur HackerRank.
  • Erreur 2 : Confondre anonymisation et pseudonymisation. L'anonymisation est irreversible (donnee non personnelle), la pseudonymisation reste reversible (donc reste personnelle au sens RGPD).
  • Erreur 3 : Mal interpreter les types de graphiques. Utiliser un camembert pour 10 categories ou un graphique 3D trompeur est une erreur classique. Reviser les regles de Cleveland.
  • Erreur 4 : Sous-estimer le domaine Gouvernance car peu pondere (14%). Les questions y sont souvent pieges (RGPD, MDM, roles). Mieux vaut le maitriser totalement.
  • Erreur 5 : Passer l'examen sans examen blanc serieux. Le format CompTIA (questions PBQ, formulations longues) deroute. Faire au moins 3 mocks avec score >80% avant de planifier.

5 questions types corrigées

Q1. Une analyste detecte qu'une colonne d'age contient des valeurs negatives et des valeurs superieures a 150. Quelle technique appliquer en priorite ?
Réponse : B
Les valeurs negatives et >150 pour un age sont des outliers/valeurs aberrantes resultant probablement d'erreurs de saisie. La methode IQR (ecart interquartile) permet de les identifier objectivement. Imputer par la moyenne (A) propagerait l'erreur, supprimer la colonne (C) est disproportionne, et la normalisation (D) ne corrige pas les aberrations. Apres detection, on peut soit supprimer les lignes concernees, soit imputer avec une valeur metier coherente.
Q2. Quel schema est le plus adapte a un data warehouse analytique optimise pour les requetes BI ?
Réponse : B
Le schema en etoile (star schema) est le standard de Kimball pour l'analytique : une table de faits centrale entouree de tables de dimensions denormalisees. Il optimise les requetes d'agregation et est natif des outils BI (Power BI, Tableau). La 3NF (A) convient au transactionnel OLTP. Le cle-valeur (C) sert au cache ou aux donnees non relationnelles. L'EAV (D) est un anti-pattern pour l'analytique.
Q3. Sous RGPD, quelle est la difference juridique principale entre anonymisation et pseudonymisation ?
Réponse : C
Sous RGPD, l'anonymisation est irreversible : la donnee ne peut plus etre rattachee a une personne, elle sort donc du champ d'application du reglement. La pseudonymisation (hachage avec sel, tokenisation) reste reversible avec une cle, la donnee demeure donc personnelle et soumise au RGPD. Cette distinction est cruciale pour les analyses : pseudonymiser n'exonere pas des obligations de consentement, de DPIA et de droits des personnes concernees.

Voir plus de questions gratuites →

Carrière & salaire après DA0-001

En France en 2026, un Data Analyst junior certifie Data+ demarre entre 38 000 et 45 000 EUR brut annuel (Paris/Lyon), avec une progression vers 50 000-60 000 EUR a 3-5 ans d'experience. Les profils confirmes (Senior Data Analyst, Lead BI) atteignent 65 000-80 000 EUR. A Bruxelles, Luxembourg ou Geneve, les salaires sont 20-35% superieurs. Debouches : Data Analyst, BI Analyst, Reporting Analyst, Business Analyst, Junior Data Engineer. Apres Data+, evolution naturelle vers des certifications specialisees : Microsoft PL-300 (Power BI), Google Data Analytics, AWS Data Analytics Specialty, Snowflake SnowPro Core, ou Databricks Data Engineer Associate. Pour un saut vers la data science : DataCamp ou IBM Data Science Professional Certificate.

Détail des salaires DA0-001 en 2026 →

FAQ — DA0-001

Combien de temps faut-il pour preparer DA0-001 ?

Entre 6 et 10 semaines avec 10-15h par semaine pour un debutant. Un profil ayant deja une experience SQL/Excel peut reduire a 4-6 semaines.

Cette certification est-elle reconnue en France ?

Oui, CompTIA est reconnu mondialement. Data+ est valorise par les ESN, cabinets de conseil et grandes entreprises. Moins connu que Microsoft ou Google cote grand public, mais credible cote RH IT.

Quel est le taux de reussite a DA0-001 ?

CompTIA ne publie pas le taux officiel, mais les communautes (Reddit, Discord) estiment 60-70% au premier passage avec une preparation serieuse de 60h minimum.

Quel est le salaire apres DA0-001 ?

En France 2026 : 38-45k EUR pour un junior, 50-60k EUR a 3-5 ans, 65-80k EUR pour les seniors. Bonus de 5-10% avec certification listee sur CV/LinkedIn.

Faut-il une experience prealable ?

Aucun prerequis obligatoire. CompTIA recommande 18-24 mois d'experience en reporting ou analyse. En pratique, un autodidacte motive peut reussir sans experience pro.

DA0-001 ou cert concurrente : laquelle choisir ?

Data+ est editeur-neutre, ideale en premiere cert. Si vous visez un ecosysteme precis : PL-300 pour Power BI, Google Data Analytics pour le cloud GCP, Tableau Specialist pour Tableau.

Combien coute l'examen DA0-001 ?

275 EUR HT via le CompTIA Store (voucher). Possibilite de bundle CertMaster + voucher + retake autour de 500-600 EUR. Reductions etudiants et militaires disponibles.

Combien de fois peut-on repasser DA0-001 ?

Pas de limite de tentatives, mais regle CompTIA : 2e tentative immediate possible, puis attente de 14 jours entre chaque tentative suivante. Chaque passage est facture plein tarif.

Prêt à passer à la pratique ?

Lancez votre examen blanc gratuit ou faites le test d'orientation pour valider votre choix.

Démarrer l'examen blanc DA0-001 → Test d'orientation