Databricks Intermédiaire

Examen MLA — MLA — Databricks Certified Machine Learning Associate

60 questions 90 min Seuil 70% 100% gratuit

À propos de l'examen MLA

L'examen MLAMLA — Databricks Certified Machine Learning Associate — est proposé par Databricks et fait partie des certifications IT les plus reconnues au niveau international. Cette épreuve évalue vos compétences pratiques et théoriques dans le domaine de databricks certified machine learning associate. L'entraînement Certifexpress comprend 60 questions au format officiel pour une durée de 90 minutes. Le score minimum requis pour réussir est de 70%. Sur cette page, découvrez 5 exemples de questions représentatives pour évaluer votre niveau avant de commencer l'entraînement complet.

Comment se préparer à l'examen MLA ?

Révisez les concepts clés couverts dans le guide officiel de l'examen MLA.
Entraînez-vous régulièrement avec des questions au format réel pour vous familiariser avec la structure de l'épreuve.
Identifiez vos points faibles grâce aux explications détaillées fournies après chaque réponse.
Gérez votre temps : simulez les conditions réelles de l'examen en vous chronométrant.
Rejoignez la communauté Certifexpress pour partager vos retours d'expérience avec d'autres candidats.

5 exemples de questions — MLA

Ces questions sont extraites aléatoirement de la banque de questions officielle. Les réponses correctes ne sont pas indiquées ici — elles sont révélées lors de l'examen complet.

1

Dans un pipeline Databricks de prédiction de maintenance prédictive, un ingénieur ML utilise des données de capteurs IoT. Il souhaite appliquer un feature engineering automatisé pour générer des centaines de features statistiques (moyenne, écart-type, min, max, tendance, etc.) à partir de séries temporelles de capteurs. Quelle approche est la plus efficace sur Databricks ?

2

Un data scientist construit un modèle de prédiction sur Databricks et constate que plusieurs colonnes numériques contiennent des valeurs manquantes (entre 5% et 20% selon les colonnes). Il utilise PySpark MLlib pour le preprocessing. Quelle stratégie d'imputation est la plus appropriée dans un pipeline MLlib production-ready ?

3

Une équipe de data science construit un pipeline de machine learning avec Spark MLlib pour prédire le churn client. Ils doivent appliquer plusieurs transformations (StringIndexer, OneHotEncoder, VectorAssembler) suivies d'un modèle LogisticRegression. Quelle est l'approche recommandée pour orchestrer ces étapes et garantir la reproductibilité du pipeline en production ?

4

Un ingénieur ML entraîne un modèle de régression avec MLflow Tracking et souhaite enregistrer la courbe d'évolution de la loss à chaque époque d'entraînement. Quelle méthode MLflow est la plus adaptée pour capturer cette information de manière exploitable dans l'interface de visualisation de MLflow ?

5

Un data scientist entraîne un modèle de classification binaire pour détecter des transactions frauduleuses. Il utilise la cross-validation avec 5 folds. Les scores AUC-ROC obtenus sur chaque fold sont : 0.92, 0.68, 0.90, 0.91, 0.89. Quelle est l'interprétation la plus correcte de ces résultats et l'action recommandée ?

📖 Préparez-vous avec nos guides

Salaires & Certifications IT 2026

Commencer l'examen MLA complet

60 questions au format officiel, corrections détaillées, suivi de votre progression. Gratuit, sans CB.

Commencer l'examen complet →