Volver al cat谩logo
DatosAvanzado
Data Engineering con Python + PySpark en Cloud
Manejar grandes volumenes requiere una arquitectura de datos moderna, orquestacion confiable y transformaciones escalables. En este curso vas a construir un stack productivo con PySpark, Airflow, dbt y AWS para llevar datos desde la ingesta hasta modelos analiticos listos para negocio.
18 leccionesCertificado incluidoUSD 10 (~ARS 10.000)
Programa del curso
1Arquitecturas modernas de datos
2 lecciones
Arquitecturas modernas de datos
- Data Lakehouse
- El stack moderno Airflow+dbt
2PySpark desde cero
3 lecciones
PySpark desde cero
- RDD vs Dataframe
- Joins y agregaciones
- Parquet/Delta
3Apache Airflow
3 lecciones
Apache Airflow
- DAGs y Ops
- Taskflow API
- Orquestaci贸n en Local
4Transformaciones con dbt
3 lecciones
Transformaciones con dbt
- dbt Core
- Models
- Tests y Macros
5Data Engineering en Cloud (AWS)
3 lecciones
Data Engineering en Cloud (AWS)
- Glue
- Redshift
- S3 Data Lakes
6Calidad de datos y gobernanza
3 lecciones
Calidad de datos y gobernanza
- Great expectations
- Data Catalog
- Lineage
7Proyecto final
1 lecciones
Proyecto final
- Pipeline Batch de ingesta y transformaci贸n orquestado
Lo que vas a aprender
PySparkApache AirflowdbtAWS S3 / GlueGreat ExpectationsData Governance
Certificado
Certificado Data Engineer Avanzado - CumbreAcademy
驴Listo para empezar?
Inversi贸n: USD 10 (~ARS 10.000)
Comprar acceso驴Quer茅s acceder a todos los cursos?
El Acceso Total te da este y todos los dem谩s por $20/mes.
Este curso: USD 10 (~ARS 10.000) - Acceso Total: $20 USD/mes (todos los cursos)
Ver Acceso Total驴Qu茅 pod茅s hacer despu茅s de este curso?
Estos son los pr贸ximos pasos recomendados seg煤n tu ruta.