AccueilCertificationsDEA-C01 › Questions gratuites

Questions gratuites DEA-C01 — AWS Certified Data Engineer — Associate

Téléchargez gratuitement 36 questions d'entraînement pour la certification DEA-C01 proposée par AWS. Toutes les questions sont accompagnées de corrections détaillées avec explications techniques.

Caractéristiques de l'examen blanc

Code de certificationDEA-C01
ÉditeurAWS
Nombre de questions36
TypeQCM avec 4 réponses possibles
Niveauassociate
CatégorieIT
Prix100% gratuit

Aperçu de 8 questions représentatives

Voici un échantillon aléatoire de 8 questions tirées de notre base d'entraînement DEA-C01. Pour accéder aux 36 questions complètes, lancez l'examen blanc gratuitement.

Question 1
Décrivez les implications de performance/coût quand on choisit entre un partitioning fin (milliers de partitions) vs partitioning grossier.
  1. Fin : meilleur pruning mais métadonnées volumineuses et liste S3 lente ; Grossier : moins de overhead métadonnées mais moins de pruning
  2. Fin : plus rapide toujours, pas de tradeoff ; Grossier : utile que pour l'archivage des anciennes données
  3. Fin : augmente les coûts de compression ; Grossier : réduit les appels API S3 sans impact de performance
  4. Fin : optimal pour très petits datasets ; Grossier : obligatoire pour volumes > 100 TB
Question 2
Un pipeline de données doit ingérer 2 TB de données d'une API REST toutes les 6 heures avec des transformations complexes. Quelle approche recommandez-vous?
  1. Utiliser AWS Glue ETL avec des jobs serverless de durée variable, orchestrés par StepFunctions pour gérer les dépendances et les erreurs
  2. Déployer des instances EC2 persistantes pour exécuter des scripts Python Apache Spark en continu
  3. Combiner Lambda avec DynamoDB pour stocker l'état d'ingestion et traiter les transformations en temps quasi-réel
  4. Utiliser Kinesis Data Firehose pour transférer les données directement vers Redshift sans transformations
Question 3
Une application doit traiter 100 000 événements par seconde en temps quasi-réel avec une latence < 1 minute. Quel service AWS est le plus approprié?
  1. Kinesis Data Streams pour l'ingestion, Lambda pour le traitement déclenché, DynamoDB pour l'agrégation temps réel
  2. Glue ETL en mode streaming avec une fréquence d'exécution de 1 minute sur des fichiers S3
  3. EventBridge pour router les événements vers SQS, puis Batch pour le traitement en parallèle
  4. RDS avec des triggers pour capturer les événements et Apache Kafka auto-managé pour le streaming
Question 4
Une entreprise doit conserver 7 ans d'historique de données avec accès décroissant. Quel design de stockage proposez-vous?
  1. S3 Standard pour 1 an actif, S3-IA pour 2-5 ans, Glacier pour 6-7 ans avec une lifecycle policy ; Lake Formation pour accès unifié
  2. Tout en S3 Standard avec des copies Redshift de l'année courante pour performance
  3. Archive tout après 1 an dans Glacier, avec extraction manuelle à la demande de l'utilisateur
  4. Dupliquer dans RDS pour les données actives et DynamoDB pour les archives (TTL = 7 ans)
Question 5
Une entreprise ingère des données IoT de 1 million d'appareils avec formats variés. Comment normaliser les entrées?
  1. Kinesis Data Streams → Lambda (parse/normalize) → Firehose → S3 (partitionné) ; Glue Catalog pour métadonnées unifiées
  2. IoT Core → DynamoDB streams → EMR cluster pour batch processing quotidien avec Spark
  3. MQTT brokers → SQS → EC2 instances pour décompresser et normaliser avant S3
  4. S3 Object Lambda pour normaliser à la lecture ; appliquer les transformations lors de la requête utilisateur
Question 6
Quel rôle joue la compressimation (ex: Snappy, Gzip) dans l'optimisation des coûts Athena?
  1. Réduit les GB scannés facturés : Athena charge les données compressées et facture les GB décompressés scannés
  2. Élimine la facturation sur Athena en compressant les résultats avant de les retourner à l'utilisateur
  3. Accélère uniquement la requête sans impact sur les coûts, la facturation dépend de la taille source brute
  4. Réduit le coût de stockage S3 mais augmente les frais Athena dues au CPU de décompression
Question 7
Un administrateur doit appliquer des transformations de données conditionnelles basées sur la valeur d'une colonne source. Quel outil est le plus approprié?
  1. Glue PySpark job avec broadcasting de lookup tables et transformations avec Spark SQL + UDFs personnalisées
  2. Athena avec requêtes SQL CASE/WHEN exécutées mensuellement pour créer des tables transformées
  3. Lambda avec DynamoDB pour stocker les règles de transformation, invoquer par S3 events
  4. Redshift avec stored procedures définissant la logique conditionnelle et UPDATE/INSERT batch quotidien
Question 8
Décrivez le concept de 'sort key' dans Redshift et ses implications de performance pour les requêtes range-based.
  1. Sort key ordonne les données sur disque ; Redshift utilise zone maps pour range pruning, évitant lire blocs inutiles
  2. Sort key crée un index similaire à PostgreSQL ; chaque colonne sort key crée un index B-tree séparé
  3. Sort key n'affecte que l'affichage des résultats ; aucun impact sur performance interne des requêtes
  4. Sort key compresse les données ; utiliser une sort key augmente le ratio de compression de 50%

Accédez aux 36 questions complètes gratuitement

Aucune carte bancaire requise. Examen chronométré, corrections détaillées, score final.

Lancer l'examen blanc DEA-C01 →

Pourquoi s'entraîner avec Certifexpress ?