Processus de migration de données : extraction, transformation puis chargement.
ETL (Extract, Transform, Load) désigne le processus classique de migration et préparation de données qui extrait depuis des sources hétérogènes (ERP, CRM, fichiers, APIs), applique des transformations (nettoyage, enrichissement, agrégation, normalisation, jointures), puis charge dans un système cible (généralement un Data Warehouse). C'est le fondement de l'intégration de données depuis les années 1980.
La variante ELT (Extract, Load, Transform) — popularisée par les Data Warehouses cloud puissants comme Snowflake et BigQuery — charge d'abord les données brutes puis les transforme directement dans le DW via SQL. ELT est devenu dominant car il exploite la puissance de calcul élastique du cloud et permet plus de flexibilité (les données brutes restent disponibles).
Les outils : Informatica PowerCenter (historique enterprise), Talend, IBM DataStage, Azure Data Factory, AWS Glue, Google Cloud Dataflow, Apache Airflow (orchestration), dbt (transformation SQL moderne), Fivetran/Stitch/Airbyte (E+L managé). Pour le streaming temps réel : Kafka, Flink, Spark Streaming. Compétence centrale pour DP-203, DEA-C01, dbt Analytics Engineer.
200+ certifications, 400 000+ questions, examens blancs chronométrés.
Voir le catalogue →