Accueil · Guides de révision · MLA-C01

Guide complet MLA-C01 — AWS

AWS Certified Machine Learning Engineer — Associate · Programme, plan de révision, ressources, examen blanc gratuit.

TL;DR — Le guide en 1 minute

La certification AWS MLA-C01 valide les competences d'un ingenieur ML capable de construire, deployer et operer des pipelines de machine learning sur AWS. Elle s'adresse aux data engineers, MLOps et developpeurs ayant 1 a 2 ans d'experience sur SageMaker. Format QCM et reponses multiples de 85 questions en 170 minutes, sans prerequis obligatoire. Debouches : MLOps Engineer, ML Engineer, Data Engineer cloud, avec des salaires entre 55k et 85k EUR en France.

Pourquoi passer la certification MLA-C01 ?

Passer la MLA-C01 en 2026 est strategique car le marche du MLOps explose : selon Gartner, 75% des entreprises europeennes auront industrialise au moins un cas d'usage ML d'ici fin 2026, et AWS reste leader avec 32% de parts de marche cloud. Cette certification associate, lancee officiellement en 2024, comble le vide entre la Data Engineer Associate et la ML Specialty (desormais retiree). Elle est tres demandee sur LinkedIn France : plus de 4200 offres mentionnent SageMaker en juin 2026. Le ROI est rapide : un profil certifie negocie en moyenne 8 a 12% de salaire supplementaire selon les etudes Robert Half 2026. Contrairement aux certifications generalistes IA, la MLA-C01 est ultra-operationnelle : elle valide la capacite a industrialiser des modeles, gerer du feature engineering a l'echelle, monitorer le drift et securiser les pipelines. Pour les freelances, le TJM moyen atteint 650 a 850 EUR/jour pour des missions MLOps AWS. Enfin, elle prepare naturellement aux roles GenAI emergents (Bedrock, Q Developer) qui dominent les recrutements 2026.

Caractéristiques de l'examen

Format	QCM et reponses multiples, 85 questions (65 notees + 20 non notees)
Duree	170 minutes
Score requis	720/1000 (environ 72%)
Prix officiel	150 USD (environ 140 EUR)
Langues	Anglais, Japonais, Coreen, Portugais brasilien (Francais non disponible en 2026)
Validite	3 ans, recertification via examen
Prerequis	Aucun officiel, recommande : 1 an minimum sur SageMaker et services data AWS

Programme détaillé par domaine

Domain 1 : Data Preparation for Machine Learning 28%

Objectifs: Ce domaine couvre l'ingestion, la transformation et la validation des donnees pour le ML. Vous devez savoir choisir le bon format de stockage (Parquet, ORC, JSONL), gerer les donnees structurees et non structurees, et appliquer des techniques de feature engineering adaptees. L'examen teste votre capacite a identifier les biais dans les datasets, gerer le desequilibre de classes (SMOTE, oversampling), et appliquer du data masking pour la conformite RGPD. Vous devez maitriser les pipelines batch et streaming, ainsi que le versioning des donnees.
Concepts clés: Maitrisez le feature scaling (standardisation, normalisation min-max), l'encodage categoriel (one-hot, target encoding, embedding), la gestion des valeurs manquantes (imputation mediane, KNN imputation) et la detection d'outliers (IQR, isolation forest). Comprenez les techniques de reduction de dimensionnalite (PCA, t-SNE) et la difference entre train/validation/test split versus k-fold cross-validation. Pour le NLP, connaissez la tokenisation, le stemming et le lemmatisation. Pour les images, maitrisez l'augmentation (flip, rotation, brightness). La conformite RGPD impose la pseudonymisation et le chiffrement at-rest avec KMS.
Services / outils: SageMaker Data Wrangler, SageMaker Feature Store (online et offline), AWS Glue (DataBrew, crawlers, jobs PySpark), Amazon EMR, Kinesis Data Streams et Firehose, S3 (lifecycle, Intelligent-Tiering), Lake Formation, Athena, Macie pour la detection PII.
Temps estimé: 15-20h

Domain 2 : ML Model Development 26%

Objectifs: Ce domaine valide votre capacite a selectionner, entrainer et optimiser des modeles. Vous devez justifier le choix d'un algorithme (XGBoost, Linear Learner, BlazingText, DeepAR) selon le probleme (classification, regression, forecasting, recommandation). L'examen evalue la comprehension du transfer learning, du fine-tuning de LLM via Bedrock et SageMaker JumpStart, et l'optimisation hyperparametrique. Vous devez interpreter les metriques d'evaluation (precision, recall, F1, AUC-ROC, RMSE, MAPE) et detecter overfitting/underfitting.
Concepts clés: Distinguez apprentissage supervise, non supervise et par renforcement. Maitrisez la regularisation L1/L2, le dropout, l'early stopping et le batch normalization. Comprenez la difference entre Bayesian Optimization, Hyperband et Random Search pour l'HPO. Connaissez les architectures : CNN pour vision, Transformers pour NLP, RNN/LSTM pour series temporelles. Pour la GenAI, maitrisez le RAG (Retrieval Augmented Generation), le prompt engineering, le LoRA et le QLoRA fine-tuning. L'interpretabilite passe par SHAP et LIME.
Services / outils: SageMaker Training Jobs, SageMaker Experiments, Automatic Model Tuning, SageMaker Autopilot, JumpStart, Bedrock (Claude, Llama, Titan), SageMaker Clarify pour le biais, Debugger pour les anomalies d'entrainement.
Temps estimé: 15-18h

Domain 3 : Deployment and Orchestration of ML Workflows 22%

Objectifs: Ce domaine couvre le deploiement en production des modeles ML. Vous devez choisir entre real-time inference, serverless inference, asynchronous inference et batch transform selon la latence et le volume. L'examen teste l'orchestration de pipelines reproductibles, le CI/CD pour ML (MLOps), la gestion multi-modeles et le scaling automatique. Vous devez maitriser les deploiements blue/green, canary et shadow pour minimiser les risques de regression.
Concepts clés: Comprenez les Multi-Model Endpoints (MME) versus Multi-Container Endpoints versus Inference Pipelines. Maitrisez les containers BYOC (Bring Your Own Container) et l'integration avec ECR. Pour le scaling, connaissez le target tracking, step scaling et scheduled scaling. Les pipelines reproductibles utilisent SageMaker Pipelines avec des steps (ProcessingStep, TrainingStep, ConditionStep). La gouvernance passe par Model Registry avec approval workflow et lineage tracking.
Services / outils: SageMaker Pipelines, Model Registry, SageMaker Endpoints (real-time, serverless, async), Step Functions, EventBridge, CodePipeline, CodeBuild, ECR, Lambda pour pre/post-processing, API Gateway.
Temps estimé: 12-15h

Domain 4 : ML Solution Monitoring, Maintenance, and Security 24%

Objectifs: Ce domaine evalue le monitoring continu des modeles en production et la securisation des pipelines ML. Vous devez detecter le data drift, le model drift, le concept drift et le feature attribution drift. L'examen teste la mise en place d'alertes CloudWatch, l'audit avec CloudTrail, et l'application du principe de moindre privilege via IAM. La conformite (HIPAA, RGPD, SOC2) et le chiffrement bout-en-bout sont essentiels.
Concepts clés: Maitrisez SageMaker Model Monitor avec ses quatre types de monitoring : data quality, model quality, bias drift et feature attribution drift. Comprenez les baselines, les statistiques de reference et les violations. Pour la securite, connaissez VPC endpoints (PrivateLink), Network Isolation pour les training jobs, KMS pour le chiffrement at-rest, et TLS pour in-transit. L'IAM doit suivre le principe de moindre privilege avec des roles d'execution dedies. Les cout doivent etre tracees via Cost Explorer et Tags.
Services / outils: SageMaker Model Monitor, Clarify, CloudWatch (metrics, logs, alarms), CloudTrail, IAM (roles, policies, conditions), KMS, VPC, PrivateLink, Secrets Manager, Config, Trusted Advisor.
Temps estimé: 12-14h

Domain 5 : ML Solution Architecture and Cost Optimization (transverse) Inclus dans les 4 domaines

Objectifs: Bien que non liste comme domaine officiel separe, l'optimisation des couts et l'architecture sont transverses a tous les domaines. Vous devez choisir les bons instance types (ml.g5, ml.inf2, ml.trn1) selon le workload, utiliser Spot Instances pour l'entrainement, et optimiser le stockage S3. L'examen teste la capacite a dimensionner correctement les ressources et a utiliser Savings Plans.
Concepts clés: Comprenez les familles d'instances : Inferentia/Trainium pour le cout/perf, GPU (G5, P4d, P5) pour le deep learning, CPU pour l'inference legere. Maitrisez Managed Spot Training avec checkpointing, SageMaker Savings Plans (jusqu'a 64% d'economie), et Inference Recommender pour le bon sizing. Les architectures hybrides utilisent SageMaker Edge pour l'IoT et Neo pour la compilation.
Services / outils: Compute Optimizer, Cost Explorer, Inference Recommender, SageMaker Neo, Savings Plans, Spot Instances, Graviton processors.
Temps estimé: 5-8h

Plan de révision hebdomadaire

Planning recommande sur 8 semaines pour un profil avec experience cloud mais peu de ML production. Semaine 1 : Lecture du Exam Guide officiel AWS et du Sample Questions PDF. Survol des 4 domaines via AWS Skill Builder (parcours MLA-C01 gratuit, 20h de contenu). Creation d'un compte AWS Free Tier. Semaine 2 : Domain 1 - Data Preparation. Labs pratiques sur Data Wrangler, Feature Store et Glue DataBrew. Construire un pipeline d'ingestion S3 vers Feature Store. Semaine 3 : Domain 2 - Model Development. Entrainer trois modeles (XGBoost classification, DeepAR forecasting, fine-tuning Bedrock Claude Haiku). Utiliser Autopilot et JumpStart. Semaine 4 : Domain 3 - Deployment. Construire un pipeline SageMaker complet avec ProcessingStep, TrainingStep, et deployer en serverless inference. Tester blue/green. Semaine 5 : Domain 4 - Monitoring et Securite. Configurer Model Monitor avec baselines, simuler du data drift, mettre en place IAM least-privilege et VPC endpoints. Semaine 6 : Premier examen blanc complet (Tutorials Dojo ou Whizlabs). Identifier les domaines faibles. Relire la documentation des services rates. Semaine 7 : Deuxieme examen blanc. Approfondir MLOps avec SageMaker Pipelines et CodePipeline. Reviser les FAQ AWS de chaque service. Semaine 8 : Troisieme examen blanc (objectif 80%+). Revision finale via flashcards Anki sur les services. Repos 24h avant l'examen. Reservation Pearson VUE ou online proctoring PSI. Total estime : 80 a 100h de preparation effective.

Besoin d'un planning sur mesure ? 30 jours · 60 jours · 90 jours

Ressources recommandées

AWS Skill Builder - Exam Prep MLA-C01

Parcours officiel gratuit avec videos, labs et questions d'examen. Inclut le Official Practice Question Set.

Stephane Maarek - Udemy MLA-C01

Cours complet en anglais (15h) tres apprecie, avec hands-on labs et examens blancs inclus.

Tutorials Dojo Practice Exams

Reference absolue pour les examens blancs (6 examens, 390 questions). Explications detaillees.

r/AWSCertifications et AWS re:Post

Communaute active : retours d'experience, conseils de revision et clarifications sur les questions ambigues.

5 erreurs classiques à éviter

Erreur 1 : Confondre Inference Pipeline et Multi-Model Endpoint. L'Inference Pipeline chaine plusieurs containers (preprocessing, modele, postprocessing) dans une seule requete, tandis que MME heberge plusieurs modeles distincts sur un meme endpoint. Lire attentivement le cas d'usage.
Erreur 2 : Negliger SageMaker Feature Store online versus offline. L'online store (DynamoDB) sert l'inference temps reel a faible latence, l'offline (S3) sert l'entrainement batch. Beaucoup confondent et choisissent la mauvaise option en exam.
Erreur 3 : Sous-estimer la securite IAM et VPC. Les questions sur Network Isolation, VPC endpoints et roles d'execution sont nombreuses. Pratiquez la configuration de training jobs isoles sans acces internet.
Erreur 4 : Mal interpreter les metriques de monitoring drift. Confondre data drift (distribution des features change) avec concept drift (relation X->Y change) est une erreur classique. Model Monitor a quatre types distincts a connaitre.
Erreur 5 : Sauter les labs pratiques en pensant que la theorie suffit. L'examen est tres scenario-based : sans avoir manipule SageMaker Pipelines, Bedrock et Feature Store, vous serez perdu sur les questions de mise en oeuvre concrete.

5 questions types corrigées

Q1. Une equipe deploie un modele de detection de fraude bancaire necessitant une latence inferieure a 100ms avec un trafic tres variable (pics a 10 000 req/s, creux a 10 req/s). Quelle solution SageMaker minimise le cout tout en respectant la SLA ?

Réponse : B

Serverless Inference est ideal pour des charges intermittentes avec forte variabilite car il ne facture que pendant l'inference active, eliminant le cout des instances idle. Il supporte une latence faible (cold start sous 1s pour modeles legers) et scale automatiquement jusqu'a MaxConcurrency. Real-time avec autoscaling (A) garde un minimum d'instances allumees, donc plus cher pour des creux a 10 req/s. Async (C) introduit de la latence (queue) et Batch (D) n'est pas temps reel. Verifier que la taille du modele est inferieure a 10GB pour Serverless.

Q2. Un ML Engineer constate que les predictions de son modele de credit scoring se degradent apres 3 mois en production, bien que la distribution des features d'entree reste stable. Quel type de drift est en cause et quel service SageMaker le detecte ?

Réponse : B

Le concept drift correspond au changement de la relation entre les features X et la cible Y, alors que la distribution de X reste stable. C'est typique en credit scoring quand les conditions economiques evoluent (taux, inflation) sans modifier les profils clients. Model Monitor Model Quality compare les predictions aux labels reels (ground truth) pour detecter ce drift. L'option A concerne le changement de distribution des inputs. Feature attribution drift (C) detecte les changements d'importance des features via SHAP. Bias drift (D) surveille les biais demographiques.

Q3. Pour fine-tuner un LLM Llama 3 sur des donnees medicales sensibles avec un budget limite, quelle architecture AWS combine efficacite cout et conformite HIPAA ?

Réponse : C

QLoRA (Quantized LoRA) reduit drastiquement les ressources GPU necessaires en quantifiant le modele de base en 4-bit et en n'entrainant que des adaptateurs low-rank, permettant le fine-tuning sur ml.g5.12xlarge (4 GPU A10G) plutot que des instances P5 couteuses. SageMaker Training avec Network Isolation, VPC endpoints PrivateLink et chiffrement KMS at-rest et in-transit satisfait HIPAA. L'option A ne supporte pas tous les modeles. B est trop couteux (ml.p5 a plus de 90$/h). D necessite une gestion manuelle de securite incompatible avec HIPAA en delai court.

Voir plus de questions gratuites →

Carrière & salaire après MLA-C01

En France 2026, un ML Engineer certifie MLA-C01 negocie entre 55 000 et 75 000 EUR brut/an en junior (1-3 ans), 75 000 a 95 000 EUR en confirme (3-6 ans), et 95 000 a 130 000 EUR en senior/staff. A Paris et en remote international, ces chiffres montent de 15 a 25%. En freelance, les TJM oscillent entre 600 et 900 EUR/jour selon la specialisation GenAI. Les debouches dominants : MLOps Engineer, ML Platform Engineer, AI Engineer chez les ESN (Capgemini, Devoteam, Accenture), les scale-ups (Mistral, Hugging Face, Doctolib) et les grands comptes (BNP, AXA, L'Oreal). Certifications complementaires recommandees : AWS Solutions Architect Associate, AWS Data Engineer Associate, puis AWS DevOps Pro pour evoluer vers Staff Engineer. Pour la GenAI specifiquement, viser la certification Bedrock specialty annoncee pour fin 2026.

Détail des salaires MLA-C01 en 2026 →

FAQ — MLA-C01

Combien de temps faut-il pour preparer MLA-C01 ?

Comptez 80 a 120h sur 6 a 10 semaines pour un profil ayant deja une experience cloud AWS et des bases en machine learning. Pour un debutant complet en ML, prevoyez 150 a 200h avec un parcours preliminaire (Coursera ML, fondamentaux Python/sklearn) avant d'attaquer la specificite AWS.

Cette certification est-elle reconnue en France ?

Oui, AWS est le cloud leader en France (33% de parts de marche en 2026 selon IDC). Les certifications AWS sont les plus demandees sur LinkedIn France et reconnues par tous les ESN, scale-ups et grands comptes. La MLA-C01, recente, est encore rare et donc tres differenciante sur le CV.

Quel est le taux de reussite a MLA-C01 ?

AWS ne publie pas les taux officiels, mais les retours communautaires (Reddit, r/AWSCertifications) estiment le taux de reussite a environ 65-70% au premier passage, plus faible que la Data Engineer Associate (75%) en raison de la profondeur ML attendue.

Quel est le salaire apres MLA-C01 ?

En France 2026, un profil certifie MLA-C01 gagne en moyenne 65 000 EUR brut/an en debut de carriere ML, jusqu'a 110 000 EUR en senior. La cert apporte typiquement 8-12% de prime salariale et facilite l'acces a des roles MLOps premium.

Faut-il une experience prealable ?

Aucun prerequis officiel, mais AWS recommande 1 an minimum d'experience pratique sur SageMaker et services data AWS (Glue, S3, Athena). Sans cela, l'examen scenario-based devient tres difficile. Suivre AWS Cloud Practitioner ou Solutions Architect Associate avant aide enormement.

MLA-C01 ou cert concurrente : laquelle choisir ?

Versus Google Cloud Professional ML Engineer ou Azure AI Engineer : choisir selon votre marche cible. AWS domine en France (gros comptes, ESN), GCP est fort en data/IA pure, Azure en environnement Microsoft. La MLA-C01 est plus tournee MLOps que sa concurrente Azure AI-102 (plus applicative).

Combien coute l'examen MLA-C01 ?

150 USD soit environ 140 EUR en juin 2026. AWS offre regulierement 50% de reduction via les vouchers obtenus en passant une cert precedente, en participant a AWS re:Invent, ou via le programme AWS Educate. Surveiller les promos AWS Skill Builder.

Combien de fois peut-on repasser MLA-C01 ?

Pas de limite totale, mais delai obligatoire de 14 jours entre deux tentatives. Chaque passage est facture 150 USD plein tarif. La certification reste valide 3 ans, recertification possible via le meme examen ou un examen de niveau superieur (ex: futur AWS ML Specialty 2.0).

Prêt à passer à la pratique ?

Lancez votre examen blanc gratuit ou faites le test d'orientation pour valider votre choix.

Démarrer l'examen blanc MLA-C01 → Test d'orientation