Transforma y analiza grandes volúmenes de datos con Apache Spark y PySpark desde cero.
me encanto, muy bien explicado.
excelente curso para iniciarse con spark
Excelente curso!! Simple pero muy erriquecedor. Como recomendación me hubiera gustado tener mas ejemplo y ejercicios
Muy interesante pero seria bueno decir que al inicio se necesita conocer lo que es contenedores para poder iniciar el curso
El contenido es entendible y se explica de manera sencilla
César Mayta
🇵🇪@cesarmaytaVer perfil
Obtén acceso de por vida solo a este curso
Obtén acceso a todos los cursos, rutas y escuelas de EDteam
En este módulo conocerás qué es Apache Spark, cómo funciona internamente y por qué es una de las tecnologías más utilizadas para el procesamiento distribuido de datos. Aprenderás sobre su arquitectura, componentes principales y ecosistema.
En este módulo aprenderás la sintaxis de PySpark para transformar, limpiar y analizar grandes volúmenes de datos. Trabajarás con DataFrames, SQL, funciones agregadas, tipos de datos y técnicas de optimización para mejorar el rendimiento. Este módulo te dará una base sólida para construir flujos de trabajo complejos en Spark usando Python.
En este módulo aplicarás todo lo aprendido creando un proyecto completo de ETL que extrae datos financieros reales con yahoo finace, transformandolos con PySpark y los cargandolos en una base de datos para su analisis de las principales acciones de la bolsa de valores.

Mostrar precios en
*Incluye todos los beneficios por comprar el curso