Accueil · Guides de révision · DEA-C01

Guide complet DEA-C01 — AWS

AWS Certified Data Engineer — Associate · Programme, plan de révision, ressources, examen blanc gratuit.

TL;DR — Le guide en 1 minute

La certification AWS Certified Data Engineer Associate (DEA-C01) valide les competences pour concevoir, construire et operer des pipelines de donnees sur AWS. Destinee aux data engineers, ETL developers et analytics engineers avec 2-3 ans d'experience, elle couvre l'ingestion, le stockage, la transformation et la gouvernance. Examen QCM de 65 questions en 130 minutes, score requis 720/1000, prix 150 EUR. Prerequis recommandes : 1 an minimum sur AWS. Debouches : Data Engineer Cloud, Analytics Engineer, Pipeline Engineer.

Pourquoi passer la certification DEA-C01 ?

En 2026, la donnee reste le carburant strategique des entreprises et AWS domine plus de 31% du marche cloud mondial. La certification DEA-C01, lancee officiellement en mars 2024, comble un vide entre la Solutions Architect Associate et les certs specialisees abandonnees (Data Analytics, Database). Le ROI est immediat : selon les enquetes Stack Overflow et Robert Half 2026, un Data Engineer certifie AWS gagne en moyenne 15 a 22% de plus qu'un profil equivalent non certifie. La demande explose avec l'essor du Lakehouse, du temps reel (Kinesis, MSK) et de l'IA generative qui necessite des pipelines de donnees robustes pour le RAG et le fine-tuning. Sur LinkedIn France, plus de 4500 offres mentionnent AWS Data Engineering en juin 2026. Cette certification valorise un CV face a des recruteurs qui privilegient des preuves concretes de competences cloud-natives sur S3, Glue, Redshift, EMR et Athena. Elle est particulierement strategique pour les profils venant de Hadoop, Spark on-premise ou Snowflake souhaitant pivoter. Elle ouvre aussi la voie vers la certification Machine Learning Specialty et les roles Lead Data Platform.

Caractéristiques de l'examen

Format QCM et reponses multiples, 65 questions
Duree 130 minutes
Score requis 720 / 1000 (environ 72%)
Prix officiel 150 EUR HT
Langues Anglais, Japonais, Coreen, Chinois simplifie (Francais non disponible en 2026)
Validite 3 ans
Prerequis Recommande : 2-3 ans en data engineering, 1-2 ans sur AWS

Programme détaillé par domaine

Domain 1 : Data Ingestion and Transformation 34%

Objectifs
Ce domaine, le plus important, evalue la capacite a concevoir des pipelines d'ingestion batch et streaming, a appliquer des transformations ETL/ELT et a orchestrer des workflows. Le candidat doit savoir choisir entre ingestion en temps reel (Kinesis Data Streams, MSK, Kinesis Firehose) et batch (AWS DMS, Transfer Family, DataSync). Il faut maitriser la programmation de jobs Glue (PySpark, Glue Studio), les transformations dans EMR, Lambda et Step Functions. La gestion des erreurs, le replay des messages, l'idempotence et les patterns de Change Data Capture (CDC) sont centraux. L'orchestration via MWAA (Airflow managed), EventBridge et Step Functions est testee en profondeur.
Concepts clés
Architectures Lambda et Kappa, patterns CDC avec DMS et Debezium, schemas evolutifs (Avro, Parquet, ORC), partitionnement, compression Snappy/ZSTD, exactly-once semantics, watermarking, fenetres glissantes et tumbling. Comprendre les differences entre Kinesis Data Streams (shards, KCL, KPL) et MSK (topics, partitions, consumer groups). Maitriser Glue Catalog, crawlers, bookmarks, et job triggers. Les Dynamic Frames vs DataFrames Spark, les jobs Glue Python Shell pour les petits volumes, et l'integration avec Iceberg sont des sujets recurrents. Connaitre les quotas, le throttling Kinesis et les strategies de retry exponentiel.
Services / outils
AWS Glue (ETL, Catalog, DataBrew), Kinesis Data Streams, Kinesis Firehose, Amazon MSK, MSK Connect, AWS DMS, AWS Lambda, Step Functions, EventBridge, MWAA (Managed Airflow), AppFlow, EMR sur EC2 et Serverless, Transfer Family.
Temps estimé
25-30h

Domain 2 : Data Store Management 26%

Objectifs
Ce domaine couvre le choix et la configuration des solutions de stockage adaptees aux workloads analytiques et operationnels. Il faut savoir dimensionner S3 (classes de stockage, lifecycle), concevoir un data lake structure (raw, curated, conformed), modeliser des entrepots Redshift (distribution keys, sort keys, materialized views) et choisir entre bases OLTP (RDS, Aurora) et NoSQL (DynamoDB, DocumentDB). Les strategies de partitionnement, de catalogage et de gestion du cycle de vie des donnees sont evaluees, ainsi que la migration et la replication entre stores.
Concepts clés
Data Lakehouse, table formats Iceberg, Hudi, Delta Lake. Optimisation Redshift : RA3 nodes, AQUA, Redshift Spectrum, concurrency scaling, workload management (WLM). DynamoDB : partition key design, GSI/LSI, on-demand vs provisioned, DAX caching, streams. S3 : Intelligent-Tiering, Glacier Instant Retrieval, Object Lambda, S3 Select, multipart upload. Comprendre les compromis CAP, eventual consistency, et les patterns de denormalisation. La gestion des partitions Hive-style et les statistiques pour le query planner sont essentielles.
Services / outils
Amazon S3, S3 Glacier, Redshift et Redshift Serverless, DynamoDB, RDS, Aurora, DocumentDB, Keyspaces, MemoryDB, ElastiCache, AWS Backup, Lake Formation.
Temps estimé
18-22h

Domain 3 : Data Operations and Support 22%

Objectifs
Ce domaine teste l'automatisation, le monitoring, le troubleshooting et l'optimisation des pipelines en production. Le candidat doit savoir instrumenter ses jobs avec CloudWatch Metrics, Logs et Alarms, configurer des alertes proactives via SNS, et tracer les executions avec X-Ray. La capacite a analyser les logs Glue, EMR, Lambda pour diagnostiquer des echecs (OOM, throttling, skew) est centrale. L'utilisation de Athena pour l'exploration ad-hoc, QuickSight pour la dataviz et OpenSearch pour l'analyse de logs est evaluee.
Concepts clés
Observabilite des pipelines : metriques custom CloudWatch, dashboards, anomaly detection. Optimisation des couts via S3 Storage Lens, AWS Cost Explorer et Compute Optimizer. Tuning Athena : partition projection, CTAS, workgroups, result reuse. Optimisation Spark sur EMR : broadcast joins, AQE, gestion du skew. Strategies de retry et dead-letter queues dans SQS et Kinesis. Comprendre les SLA, SLO, et la gestion des incidents data.
Services / outils
CloudWatch, CloudTrail, X-Ray, Athena, QuickSight, OpenSearch Service, SNS, SQS, Systems Manager, Trusted Advisor, AWS Health Dashboard.
Temps estimé
15-18h

Domain 4 : Data Security and Governance 18%

Objectifs
Ce domaine evalue la securisation des donnees au repos et en transit, la gouvernance via Lake Formation, et la conformite reglementaire (RGPD, HIPAA, PCI-DSS). Le candidat doit maitriser le chiffrement KMS (CMK, envelope encryption, key rotation), les politiques IAM granulaires, les VPC endpoints pour isoler le trafic, et la classification automatique avec Macie. La gestion des permissions fine-grained (column-level, row-level, cell-level) via Lake Formation et les tags est testee.
Concepts clés
Principle of least privilege, separation of duties, audit trails CloudTrail, masquage dynamique des donnees, tokenisation. Configuration de Lake Formation : data filters, LF-tags, cross-account sharing via Resource Access Manager. Chiffrement S3 SSE-S3, SSE-KMS, SSE-C, et chiffrement Redshift, RDS, DynamoDB. Gestion des secrets avec Secrets Manager et Parameter Store. Comprendre les CORS, les pre-signed URLs et la signature V4.
Services / outils
AWS IAM, KMS, Lake Formation, Macie, Secrets Manager, AWS Config, GuardDuty, CloudTrail, VPC, PrivateLink, AWS RAM, Audit Manager.
Temps estimé
12-15h

Domain 5 : Transverse - Architecture et Bonnes Pratiques Transverse

Objectifs
Bien que non liste comme domaine officiel separe, l'examen integre des questions transverses sur le Well-Architected Framework applique a l'analytique : Data Analytics Lens, Operational Excellence, cost optimization. Le candidat doit savoir choisir le bon service selon le contexte (volume, latence, cout, complexite). Les patterns d'integration multi-comptes, multi-regions et hybrides on-premise/cloud sont aussi abordes.
Concepts clés
Well-Architected Data Analytics Lens, principes FinOps, design for failure, decoupling via messaging, idempotence, immutabilite des donnees. Choix Redshift vs Athena vs EMR selon le pattern d'usage. Architectures event-driven avec EventBridge schemas registry. Strategies de disaster recovery : RPO, RTO, multi-region replication.
Services / outils
Well-Architected Tool, AWS Organizations, Control Tower, Resource Groups, Service Catalog, CloudFormation, CDK.
Temps estimé
8-10h

Plan de révision hebdomadaire

Planning recommande sur 10 semaines a raison de 8-10h hebdomadaires. Semaine 1 : Lecture de l'Exam Guide officiel DEA-C01, creation d'un compte AWS Free Tier, tour d'horizon des 5 domaines via la formation Skill Builder gratuite 'Exam Prep Standard Course'. Semaine 2-3 : Domain 1 (Ingestion). Labs pratiques : creer un pipeline Kinesis Firehose vers S3, un job Glue avec crawler, orchestrer avec Step Functions. Lire la documentation Glue et Kinesis. Semaine 4-5 : Domain 2 (Stockage). Deployer un cluster Redshift Serverless, modeliser un schema en etoile, experimenter Iceberg sur S3 via Athena, configurer DynamoDB avec GSI. Semaine 6 : Domain 3 (Operations). Mise en place CloudWatch dashboards, alarms, troubleshooting d'un job Glue qui echoue, optimisation Athena via partition projection. Semaine 7 : Domain 4 (Securite). Configuration Lake Formation avec LF-tags, chiffrement KMS, audit Macie sur un bucket S3, IAM policies fine-grained. Semaine 8 : Premier examen blanc complet (Tutorials Dojo ou Whizlabs), analyse des erreurs, revision ciblee des points faibles. Semaine 9 : Deuxieme examen blanc, deep dive sur les services les moins maitrises, relecture du Data Analytics Lens du Well-Architected Framework. Semaine 10 : Examen blanc officiel AWS (20 USD), revision finale des cheat sheets, repos avant l'examen. Passer l'examen en debut de semaine 11 pour eviter la fatigue.

Besoin d'un planning sur mesure ? 30 jours · 60 jours · 90 jours

Ressources recommandées

Documentation officielle AWS DEA-C01

Exam guide officiel, sample questions et liens vers les whitepapers indispensables.

AWS Skill Builder - Exam Prep Standard Course

Parcours gratuit officiel avec videos, labs et examen blanc inclus. Reference incontournable.

Tutorials Dojo Practice Exams DEA-C01

Examens blancs reputes les plus proches de l'examen reel, avec explications detaillees par Jon Bonso.

Reddit r/AWSCertifications et Discord Cloud Resume Challenge

Communautes actives partageant retours d'experience, conseils et erreurs typiques a eviter.

5 erreurs classiques à éviter

  • Erreur 1 : Negliger les services hors Glue et Redshift. Beaucoup se concentrent sur ces deux services mais l'examen teste largement MSK, Lake Formation, MWAA et DynamoDB. Construire des labs sur ces services moins populaires.
  • Erreur 2 : Confondre Kinesis Data Streams et Kinesis Firehose. KDS est temps reel avec consumers custom, Firehose est un delivery service vers S3/Redshift/OpenSearch avec buffering. Bien identifier les cas d'usage de chacun.
  • Erreur 3 : Sous-estimer Lake Formation. Les questions sur les LF-tags, les data filters et le partage cross-account sont nombreuses. Pratiquer concretement la configuration de permissions row-level et column-level.
  • Erreur 4 : Mal connaitre les classes de stockage S3 et leurs couts. Confondre Glacier Instant Retrieval, Flexible Retrieval et Deep Archive coute des points. Memoriser les latences et minimum storage duration.
  • Erreur 5 : Reviser sans pratique hands-on. L'examen valorise l'experience reelle. Faire au moins 30h de labs pratiques, pas uniquement des QCM, pour comprendre les subtilites operationnelles.

5 questions types corrigées

Q1. Une entreprise ingere 50 To/jour de logs applicatifs vers S3 via Kinesis Firehose. L'equipe veut interroger ces donnees avec Athena tout en minimisant les couts. Quelle approche est la plus efficace ?
Réponse : B
Firehose supporte nativement la conversion Parquet via Glue Catalog et le partitionnement dynamique. Parquet columnar avec Snappy reduit drastiquement les couts Athena (facture par To scanne) et accelere les requetes. Le partitionnement par date permet le partition pruning. L'option D ajoute complexite et latence inutiles, et A/C generent des couts Athena prohibitifs sur 50 To/jour. Cette architecture serverless est le pattern recommande par AWS Well-Architected Analytics Lens pour l'ingestion de logs a grande echelle.
Q2. Un data engineer doit accorder a une equipe analyste l'acces aux colonnes non-PII d'une table Glue stockee dans un data lake S3. Quelle solution est la plus appropriee ?
Réponse : B
Lake Formation offre une gestion centralisee des permissions fine-grained, incluant column-level, row-level et cell-level security via LF-tags. C'est l'approche recommandee par AWS car elle est auditable, reutilisable et integree avec Athena, Redshift Spectrum et EMR. L'option A demande maintenance manuelle des vues. L'option C duplique les donnees, coute cher et cree des risques de desynchronisation. L'option D rend les colonnes illisibles meme pour les utilisateurs autorises. Lake Formation est un sujet majeur du Domain 4 et apparait frequemment a l'examen.
Q3. Un cluster Redshift presente des temps de requetes degrades sur une table de faits de 5 milliards de lignes. Les jointures avec une dimension produit sont lentes. Quelle optimisation est la plus efficace ?
Réponse : B
Le pattern optimal pour les jointures star schema dans Redshift est de distribuer la table de faits sur la cle de jointure (DISTKEY product_id) et de repliquer la petite dimension sur tous les nodes (DISTSTYLE ALL). Cela elimine le shuffle reseau lors des jointures, source principale de latence. Augmenter les nodes ne resout pas un mauvais design de distribution. Concurrency Scaling adresse la concurrence, pas la performance individuelle. Spectrum est plus lent que Redshift natif pour des requetes frequentes. La maitrise des DISTKEY/SORTKEY est fondamentale pour le Domain 2.

Voir plus de questions gratuites →

Carrière & salaire après DEA-C01

En France et en Europe 2026, un Data Engineer AWS certifie DEA-C01 percoit entre 50 000 et 65 000 EUR bruts annuels en debut de carriere, 65 000 a 85 000 EUR avec 3-5 ans d'experience, et au-dela de 95 000 EUR pour les profils seniors a Paris, Londres ou Amsterdam. En freelance, les TJM oscillent entre 600 et 950 EUR. La certification ouvre des roles de Data Engineer Cloud, Analytics Engineer, Pipeline Engineer, Platform Engineer et Lead Data. Evolution naturelle : AWS Solutions Architect Professional, AWS Machine Learning Specialty, ou Databricks Certified Data Engineer Professional pour les profils Lakehouse. Les secteurs banque, assurance, retail et media recrutent massivement. Combinee a Terraform et dbt, elle constitue un profil tres recherche.

Détail des salaires DEA-C01 en 2026 →

FAQ — DEA-C01

Combien de temps faut-il pour preparer DEA-C01 ?

Entre 80 et 120 heures selon votre experience. Avec une base AWS solide (1 an d'experience), comptez 2 mois a 10h/semaine. Sans experience AWS, prevoyez 3 a 4 mois avec passage prealable du Cloud Practitioner.

Cette certification est-elle reconnue en France ?

Oui, c'est l'une des certifications cloud data les plus valorisees en France. Les ESN (Capgemini, Sopra, Devoteam), cabinets de conseil et editeurs la demandent explicitement dans leurs offres data engineering.

Quel est le taux de reussite a DEA-C01 ?

AWS ne publie pas de taux officiel. Selon les retours communautaires en 2026, le taux estime est de 55 a 65% au premier passage, ce qui en fait un examen exigeant pour une certification Associate.

Quel est le salaire apres DEA-C01 ?

Un junior gagne 50-55k EUR, un confirme 65-80k EUR, un senior 85-100k+ EUR en France. A Paris et en region parisienne, ajouter 10-15%. Les freelances facturent 600-950 EUR/jour.

Faut-il une experience prealable ?

AWS recommande 2-3 ans en data engineering et 1-2 ans sur AWS, sans rendre ces prerequis obligatoires. Une experience pratique reelle est neanmoins indispensable pour les questions scenario-based.

DEA-C01 ou cert concurrente : laquelle choisir ?

Si votre cible est AWS, DEA-C01 est incontournable. Pour un focus Lakehouse, complementer avec Databricks Certified Data Engineer. Pour GCP, Professional Data Engineer. Azure, DP-203. DEA-C01 reste la plus demandee en Europe.

Combien coute l'examen DEA-C01 ?

150 USD soit environ 150 EUR HT en 2026. AWS offre un voucher de 50% de reduction apres reussite d'une premiere certification. Skill Builder propose un examen blanc officiel a 20 USD.

Combien de fois peut-on repasser DEA-C01 ?

En cas d'echec, un delai de 14 jours est obligatoire avant de repasser l'examen. Aucune limite sur le nombre total de tentatives, mais chaque passage est facture au tarif plein 150 USD.

Prêt à passer à la pratique ?

Lancez votre examen blanc gratuit ou faites le test d'orientation pour valider votre choix.

Démarrer l'examen blanc DEA-C01 → Test d'orientation