Volver al cat谩logo
DatosAvanzado

Data Engineering con Python + PySpark en Cloud

Manejar grandes volumenes requiere una arquitectura de datos moderna, orquestacion confiable y transformaciones escalables. En este curso vas a construir un stack productivo con PySpark, Airflow, dbt y AWS para llevar datos desde la ingesta hasta modelos analiticos listos para negocio.

18 leccionesCertificado incluidoUSD 10 (~ARS 10.000)

Programa del curso

1

Arquitecturas modernas de datos

2 lecciones
  • Data Lakehouse
  • El stack moderno Airflow+dbt
2

PySpark desde cero

3 lecciones
  • RDD vs Dataframe
  • Joins y agregaciones
  • Parquet/Delta
3

Apache Airflow

3 lecciones
  • DAGs y Ops
  • Taskflow API
  • Orquestaci贸n en Local
4

Transformaciones con dbt

3 lecciones
  • dbt Core
  • Models
  • Tests y Macros
5

Data Engineering en Cloud (AWS)

3 lecciones
  • Glue
  • Redshift
  • S3 Data Lakes
6

Calidad de datos y gobernanza

3 lecciones
  • Great expectations
  • Data Catalog
  • Lineage
7

Proyecto final

1 lecciones
  • Pipeline Batch de ingesta y transformaci贸n orquestado

Lo que vas a aprender

PySparkApache AirflowdbtAWS S3 / GlueGreat ExpectationsData Governance

Certificado

Certificado Data Engineer Avanzado - CumbreAcademy

驴Listo para empezar?

Inversi贸n: USD 10 (~ARS 10.000)

Comprar acceso

驴Quer茅s acceder a todos los cursos?

El Acceso Total te da este y todos los dem谩s por $20/mes.

Este curso: USD 10 (~ARS 10.000) - Acceso Total: $20 USD/mes (todos los cursos)
Ver Acceso Total

Inscribirse

USD 10 (~ARS 10.000)
Comprar acceso