La creciente demanda de datos en las organizaciones para sus proyectos de inteligencia de negocios, ciencia de datos e inteligencia artificial, requieren de un gran soporte tecnológico y soluciones robustas capaces de transportar y procesar tales datos, desde las fuentes originales que pueden abarcar desde bases de datos transaccionales hasta archivos en la web, hacia cada uno de los puntos o terminales donde se requieran para su explotación. Por ello resulta necesario contar con profesionales que estén en la capacidad de planear e implementar ETL’s y data pipelines que maximicen la calidad del dato, sobre todo, en términos de su oportunidad, precisión y confianza. Por ello, DMC Perú presenta el “Curso Python for Data Engineering”, el cual te permitirá emplear este demandado y versátil lenguaje para la implementación de soluciones ETL, destinadas al transporte y procesamiento de datos entre diversas fuentes, empleando en el proceso sus principales librerías, método y componentes.

Pre-requisito: Sólidos conocimientos de programación, de preferencia con lenguaje Python. Conocimiento de estructura de bases de datos.

Objetivo General:

Aprende a emplear el lenguaje Python para la implementación de soluciones ETL, destinadas al transporte y procesamiento de datos entre diversas fuentes, empleando en el proceso la librería Pandas, los DataFrames y sus diversos métodos.

Objetivos Específicos:

  •  Aprende sobre los fundamentos de los ETL, en qué consisten, y cómo puede emplearse el lenguaje Python para su implementación.
  • Aprende los principales comandos de este lenguaje de programación, con énfasis en aquellos aplicables a la implementación de ETL, como son tipos de datos, manejo de instrucciones y excepciones, manejo de APIs, entre otros.
  • Aprende a emplear el lenguaje Python para mapear bases de datos relacionales a través de las herramientas denominadas ORM, las cuales a su vez te permitirán intercambiar datos de manera fácil y rápida entre tablas y objetos de Python.
  • Aprende a emplear la famosa librería Pandas de Python, para la manipulación de conjuntos de datos en elementos denominadas DataFrames, y las múltiples operaciones que pueden realizarse con ellas.

Resumen del contenido:

  • Fundamentos de ETL con Python.
  • Introducción a Python.
  • Object Relational Mapper.
  • Pandas, Series y DataFrames.

Julio Córdova

Chapter Leader Analytics & Data Architecture en Kyndryl, previamente ha tenido experiencia en The Bridge Social, Zoluxiones, MDP CONSULTING S.A.C, Prisma Counselling y Claro Perú.
product_img1
Inversión: S/654.00 S/1,090.00
Inicio: 19/03/2024
Fin: 09/04/24
24 hrs. Académicas
Online, 100% en vivo
6 sesiones
Ma - Ju / 7:30PM - 10:30PM
Certificado de aprobación