En este video te traemos un workshop 100% práctico de Pyspark con python.
PySpark es la API de Python para Apache Spark. Le permite realizar procesamiento de datos a gran escala en tiempo real en un entorno distribuido utilizando Python. También proporciona un shell PySpark para analizar sus datos de forma interactiva.
En este video desarrollaremos un proceso de ETL para usar pyspark de manera local bajo el servicio de Google Colab.
Link de la data:
github.com/lui...
#dataanalytics #datascience #csv #dataframes #pythontutorial #coding #codingskills #pandas #eda
Негізгі бет Python y PySpark: ¡Aprende a hacer ETL como un PRO!
Пікірлер: 43