Accueil › Certifications › DEA-C01 › Questions gratuites

Questions gratuites DEA-C01 — AWS Certified Data Engineer — Associate

Téléchargez gratuitement 36 questions d'entraînement pour la certification DEA-C01 proposée par AWS. Toutes les questions sont accompagnées de corrections détaillées avec explications techniques.

Caractéristiques de l'examen blanc

Code de certification	DEA-C01
Éditeur	AWS
Nombre de questions	36
Type	QCM avec 4 réponses possibles
Niveau	associate
Catégorie	IT
Prix	100% gratuit

Aperçu de 8 questions représentatives

Voici un échantillon aléatoire de 8 questions tirées de notre base d'entraînement DEA-C01. Pour accéder aux 36 questions complètes, lancez l'examen blanc gratuitement.

Question 1

Un administrateur observe une requête Redshift qui s'exécute à 80% de la limite de mémoire disponible du nœud. Comment optimiser?

Réduire les spill-to-disk via optimisation des joins (broadcast small table), compression, et distribution key appropriée
Ajouter immédiatement un nœud supplémentaire pour augmenter la mémoire du cluster
Modifier le timeout de requête pour tolérer la mémoire élevée sans intervention
Migrer la table vers RDS pour la décharger de Redshift et réduire la consommation mémoire

Question 2

Une entreprise intègre des données de 10 sources externes différentes avec des schémas hétérogènes. Comment gérer les transformations de schéma?

Utiliser Glue Data Catalog avec AWS Glue SchemaRegistry pour versioner les schémas et orchestrer les transformations via StepFunctions
Créer un mapping manuel en SQL dans Athena pour normaliser chaque source lors de la requête
Importer toutes les données brutes en DynamoDB puis transformer avec Lambda en parallèle
Utiliser une instance Spark autonome pour appliquer des règles de transformation codées en PySpark

Question 3

Un pipeline Glue doit gérer une montée en charge soudaine passant de 10 GB à 500 GB en 1 heure. Comment configurer l'auto-scaling?

Utiliser des workers Glue serverless avec DPU (Data Processing Units) dynamiques, combiné avec max concurrency dans StepFunctions
Configurer des workers G.2X fixes en augmentant manuellement la capacité avant la montée en charge
Utiliser des workers G.1X et ajuster le spark.parallelism pour distribuer la charge automatiquement
Basculer vers Lambda pour le traitement parallèle des petits fichiers distribués sur S3

Question 4

Décrivez les implications de performance/coût quand on choisit entre un partitioning fin (milliers de partitions) vs partitioning grossier.

Fin : meilleur pruning mais métadonnées volumineuses et liste S3 lente ; Grossier : moins de overhead métadonnées mais moins de pruning
Fin : plus rapide toujours, pas de tradeoff ; Grossier : utile que pour l'archivage des anciennes données
Fin : augmente les coûts de compression ; Grossier : réduit les appels API S3 sans impact de performance
Fin : optimal pour très petits datasets ; Grossier : obligatoire pour volumes > 100 TB

Question 5

Une application doit traiter 100 000 événements par seconde en temps quasi-réel avec une latence < 1 minute. Quel service AWS est le plus approprié?

Kinesis Data Streams pour l'ingestion, Lambda pour le traitement déclenché, DynamoDB pour l'agrégation temps réel
Glue ETL en mode streaming avec une fréquence d'exécution de 1 minute sur des fichiers S3
EventBridge pour router les événements vers SQS, puis Batch pour le traitement en parallèle
RDS avec des triggers pour capturer les événements et Apache Kafka auto-managé pour le streaming

Question 6

Un architecte doit ingérer des données d'une API qui expose 10 millions de records avec pagination curseur. Quel pattern minimise la latence?

Paralléliser les appels API via Lambda avec invocations asynchrones StepFunctions, paginer en parallèle avec curseurs décalés
Créer une Lambda unique qui pagine séquentiellement et stocke les données directement dans RDS
Utiliser Glue ConnectionType pour la source API avec retry exponential intégré
Configurer une réplication native Kinesis depuis l'API source vers Firehose vers S3

Question 7

Quel est le rôle de la distribution key dans Redshift et comment l'impropre choix affecte les performances?

Détermine la distribution des lignes entre nœuds ; une mauvaise clé crée du data skew et joins coûteux cross-node
Identifie la clé primaire pour l'indexation ; ne pas la configurer désactive les index et ralentit les SELECT
Compresse les données selon la clé ; une clé avec faible cardinalité maximise la compression Redshift
Encrypte les données avant stockage ; Redshift requiert une distribution key pour la sécurité KMS

Question 8

Une entreprise traite 500 GB de données de logs quotidiennement stockées en S3. Les requêtes analytiques sur les 30 derniers jours sont fréquentes, mais les données plus anciennes ne le sont jamais. Quelle stratégie de partitionnement recommandez-vous?

Partitionner par date (year/month/day) et mettre en place une lifecycle policy S3 pour archiver automatiquement les données au-delà de 30 jours vers Glacier
Stocker toutes les données dans un seul bucket S3 sans partitionnement et créer des projections Athena pour virtualiser les dates
Particolonner par région géographique et répliquer les 30 derniers jours dans RDS pour accélérer les requêtes
Utiliser DynamoDB comme stockage principal avec TTL global de 30 jours pour automatiser la suppression

Accédez aux 36 questions complètes gratuitement

Aucune carte bancaire requise. Examen chronométré, corrections détaillées, score final.

Lancer l'examen blanc DEA-C01 →

Pourquoi s'entraîner avec Certifexpress ?

Questions au format officiel AWS
Corrections détaillées avec explications techniques (200+ mots par question)
Examen chronométré comme le jour J
Option "Refaire les questions ratées" pour cibler vos lacunes
Suivi de votre progression dans votre tableau de bord personnel
Accès illimité, aucun abonnement requis