Fundamentos de Web Scraping
- Consumo de datos on-line. Fuentes API (crudo) y HTML (renderizado).
- Web Scraping vs. Web Crawling.
- Consecuencias del escrapeo. El User Agent y bloqueo de páginas web.
- Consideraciones éticas y legales del scrapeo.
La web y sus componentes
- Conceptos básicos sobre la web: DOM, HTML, CSS, JS.
- Taller: Construcción de una página web básica con etiquetado HTML y sentencias CSS.
Métodos de scraping
- Web Scraping estático con LXML y Playwright.
- Taller: Scraping basado en Playwrigth.
- Web Scraping dinámico con Selenium. Configuración de drivers por navegador.
- Taller: Scraping basado en Selenium.
Storing y serialización de datos
- Objetivos de la serialización de datos.
- Formatos No binarios, Binarios.
- Taller: Serialización de datos JSON, YAML, BSON, MessagePack. entre otros.