Advanced Python I. Database Control
- Repaso de principales librerías para procesamiento de datos.
- ORM utilizando SQLAlchemy.
- ETL con pandas y SQLAlchemy
- Control de concurrencia, multiprocesamiento (Uso de
ThreadPoolExecutor). - Taller: Construcción de un framework de procesamiento de
datos. - Taller: Extraer datos de un API e insertarlos en una base de datos
relacional.
Advanced Python II. Data Extraction with APIs
- Fundamentos Web Scraping utilizando Selenium.
- Cómo evitar las trampas en el proceso del Web Scraping
(Ajustando encabezados, Manejo de cookies con JavaScript,
Huellas dactilares TLS,Timing Is Everything). - Expresiones regulares.
- Web Scraping in Parallel.
- Web Scraping Proxies.
- Taller: Obtener datos de un archivo PDF utilizando expresiones
regulares. - Taller: Web Scraping a sitios web.
Advanced Python III. Proactive Data Cleaning
- Anticipar problemas de limpieza de datos al importar datos
tabulares a Pandas. - Anticipar problemas de limpieza de datos al trabajar con HTML,
JSON - Identificación de valores faltantes y valores atípicos en
subconjuntos de datos. - Uso de visualizaciones para la identificación de valores
inesperados. - Taller: Limpieza e identificación de valores anómalos en un
dataset.