
🎯 Objetivos del Curso
✅ Implementar procesos ETL (Extracción, Transformación y Carga) utilizando Python y la biblioteca Pandas.
✅ Manejar y transformar datos de diversas fuentes para prepararlos para análisis posteriores.
Horarios


Inicio de clases
Duración: 15 h
Martes y Jueves, 18-Nov- 2-Dic
19:00 – 22:00
S/320.00
ETL y Manipulación de Datos con Python y Pandas
Temario
⏳ Duración total: 15 horas
📌 Modalidad: Teórico-práctico ( Clases en Vivo)
Módulo 1: Introducción a ETL y Fundamentos de Python
Conceptos Básicos de ETL:
Definición y etapas del proceso ETL (Extracción, Transformación y Carga).
Importancia del ETL en la gestión y análisis de datos.
Fundamentos de Python para ETL:
Sintaxis básica de Python y estructuras de datos esenciales.
Introducción a entornos de desarrollo como Jupyter Notebook y PyCharm
Módulo 2: Introducción a Pandas y Manejo de Datos
Introducción a Pandas:
Creación y manipulación de Series y DataFrames.
Importación y exportación de datos en formatos como CSV, Excel y JSON.
Manejo y Limpieza de Datos:
Detección y manejo de valores nulos.
Eliminación de duplicados y transformación de datos.
Módulo 3: Procesos de Extracción de Datos
Extracción desde Archivos Planos:
Lectura de datos desde archivos CSV y Excel.
Manejo de datos no estructurados y semi-estructurados.
Extracción desde Bases de Datos y APIs:
Conexión a bases de datos SQL y NoSQL.
Consumo de datos desde APIs RESTful.
Módulo 4: Transformación y Limpieza de Datos
Transformaciones Básicas y Avanzadas:
Filtrado, agrupación y ordenamiento de datos.
Aplicación de funciones personalizadas y operaciones vectorizadas.
Integración con Otras Herramientas:
Uso de bibliotecas adicionales como NumPy para operaciones numéricas.
Integración con herramientas de visualización como Matplotlib y Seaborn.
Módulo 5: Carga de Datos y Automatización de Procesos ETL Carga de Datos:
Inserción de datos transformados en bases de datos y otros sistemas de almacenamiento.
Exportación de datos a diferentes formatos para su distribución.
Automatización y Programación de Tareas ETL:
Uso de bibliotecas como Airflow para la automatización de flujos de trabajo ETL.
Programación y monitoreo de tareas ETL.