Máster Internacional en Data Engineering on Cloud - DMC Perú
Productos
Crear una cuenta

CAPACITACIONES

Alianzas que respaldan nuestro trabajo

Máster Internacional en Data Engineering on Cloud

El uso y explotación de los datos es transversal a las áreas o puestos de trabajo de una organización y la democratización de estos se ha vuelto crítica para la toma decisiones, el diseño de estrategias y la creación de ventaja competitiva. Frente a este panorama, la demanda de profesionales que estén en la capacidad de poner
los datos a disposición de todo aquel que lo necesite en la compañía y, sobre todo, a partir de soluciones basadas en las mejores alternativas tecnológicas, se ha vuelto indispensable.

30% Dto.

El precio original era: $4,317.30.El precio actual es: $3,022.11.

Hablar con un asesor

Pre-requisitos:

Conocimientos en programación Python y manejo de entornos Windows y Linux. Experiencia laboral mayor a dos años desarrollando proyectos de ciencia, análisis o ingeniería de datos. Tener instalado los softwares y herramientas señalados en la sección Contenidos.

Profesor: Leslie Lugo

Profesor: Isui Guzman

BI Reporting Leader Data & Analytics en
WALMART DE MÉXICO Y CENTROAMÉRICA

Profesor: Richard Quispe

Sub Gerente Adjunto Planning & Analytics GDHA en
BCP

Profesor: Gustavo Rangel

Head de iniciativas de IA y Cloud – Maypo

Profesor: Daniel Ayvar

Gerente de Gobierno de Datos en
MIBANCO

Profesor: Shirley Villacorta

Senior Associate en PwC Perú. Magíster en auditoría y Ejecutivo Senior. Más de 14 años de experiencia realizando auditoría de sistemas, ciberseguridad y seguridad de la información para diversos sectores. Cuenta con las certificaciones CISA, ISO 27032 Lead Cybersecurity Manager, Lead Cybersecurity Professional Certificate, ISO 27001 y OKR Certified Professional.

Profesor: Juan Salinas

Senior Data Engineer en Encora, previamente ha tenido experiencia en Belcorp, Derco, Grupo El Comercio y Tekton Labs. MBA e Ingeniero Industrial por la Universidad Autónoma del Perú.

Profesor: Daniela Gonzalez

Profesor: Jorge Bustamante

Profesor: Dennys Rafael

Gerente de Valor y Portafolio Data Analytics en
ALICORP

Profesor: Guillermo Acha

Profesor: Christian Sanchez

Senior Data Engineer en
PACÍFICO SEGUROS

Profesor: Anita Quevedo

Cloud Partner Engineer en
GOOGLE

Profesor: Miguel Garcia

Especialista en TI en E2E

Inicio: 27/11/2024
Fin: 15/10/2025
Online, 100% en vivo
284 hrs. académicas
72 - Sesiones
Certificación

Características

Clases en Vivo
El 100% de las clases que se desarrollan en el curso son en vivo.
Plataforma E-Learning
Accede en cualquier momento a materiales complementarios: lecturas, videos, tutoriales, clases grabadas y más.
Asesoría Académica
Resuelve tus dudas con el asistente académico en línea.
Aprende Haciendo
Desarrolla casos con datos reales, incluso puedes proponer casos de tu propio sector.
Certificación
Con una nota mínima de 14 sobre 20 y una asistencia mínima del 80%
Soporte Técnico
Soporte Técnico Asistencia técnica permanente y acceso a máquinas virtuales de ser necesario.

Lo que vas a obtener con este curso

Objetivo General:

Aprende a desarrollar proyectos de ingeniería de datos con enfoque en negocios, considerando tanto soluciones para datos relacionales mediante Data Warehouses robustos, así como aquellas para datos mixtos mediante Data Lakes y servicios nube que garanticen la democratización de los datos y la continuidad del negocio.

Objetivos Específicos:

  • Aprende a descubrir el líder que existe en ti, a cómo generar engagement de equipos y a liderarlos para obtener el máximo
    rendimiento, ya sea con orientación a equipos de datos o a cualquier otro que toque liderar.
  • Aprende a plantear una estrategia de datos alineada a los grandes objetivos corporativos y a plasmarla en un roadmap, empleando en el proceso diversos artefactos y herramientas.
  • Aprende a diseñar arquitecturas de datos, tanto desde una perspectiva holística que contemple el flujo y control de Big Data, tecnología ETL y ELT, Data lake, entre otros. Así como a nivel específico, a través del modelamiento de bases OLTP y su transición hacía OLAP.
  • Aprende a implementar un Data Warehouse multicapa en SQL Server, empleando de manera complementaria su herramienta SQL Server Integration Services (SSIS) para el diseño y puesta en funcionamiento
    de procesos ETL para poblarlo. Finalmente, revisa servicios cloud para el despliegue y uso inmediato de Data Warehouses corporativos (Platform as a Service), como Snowflake, Dbt, y otros exclusivos de Azure, AWS y GCP.
  • Aprende sobre el gobierno de datos, sus principales conceptos y artefactos aplicables el contexto de Data Engineering, como catálogos y diccionarios, linaje, calidad de datos, etc, mientras aplicas el marco de trabajo DMBOK para el diagnóstico de madurez a un caso de uso y la propuesta de un plan de acción.
  • Aprende sobre los diferentes marcos normativos aplicables a la seguridad y calidad de datos como las normas ISO 27000 e ISO 8000. Así como a aplicar técnicas de encriptación y tokenización para proteger los datos en los proyectos de ingeniería de datos.
  • Aprende a planificar, diseñar e implementar un proyecto Data Warehouse que soporte proyectos actuales y futuros de datos (Data Roadmap), acorde a los planes organizacionales.
Malla Curricular:
Data-team Leadership
  • Me conozco. Autoconocimiento y descubrimiento del líder que hay en mí. 
  • Colaboro. Engagement de equipos. 
  • Lidero. Escucho, inspiro y guío. 
Data Strategy Plan Máster

Estrategia de datos

  • Definición, enfoque e impacto en las organizaciones.
  • Roles en equipos de data y analytics.
  • Artefactos para el diseño de una estrategia de datos.
  • Recomendaciones y buenas prácticas en el diseño de una
    estrategia de datos.
  • Taller: Diseño del roadmap de una estrategia de datos

Data Architecture &Modeling Fundamentals Máster

Data Engineering Lifecycle

  • Evolución de la Ingeniería de datos.
  • ETL vs ELT.
  • Arquitectura de una solución BI.
  • Modelos Multidimensionales.
  • Tecnologías Data Storage y Data Process.
  • Taller: Desarrollo de un diagrama de una arquitectura BI.

Modern Data Architecture

  • Arquitectura de una solución Big Data.
  • Taxonomía del Datalake.
  • Tecnologías y servicios relacionados a la arquitectura moderna
    de datos.
  • Arquitecturas de referencia.
  • Taller: Desarrollo de un diagrama de una arquitectura moderna
    de datos.

Data Modeler Fundamentals

  • Tipos de modelos de datos.
  • Modelo Conceptual, físico y lógico.
  • Fundamentos de normalización.
  • Cardinalidad.
  • OLTP vs OLAP.
  • Taller: Creación de un diagrama de Modelo lógico.

Data Modeler Dimensional

  • Modelos dimensionas (Star Schema y Snowflake Schema).
  • Modelamiento del Data warehouse.
  • Modelamiento del Data lakehouse.
  • Diseño de dimensiones (SCD).
  • Taller: Diseño de un modelo OLAP a partir de uno OLTP.
Advanced Data Warehousing(SQLSERVER, SSIS)


Traditional Data Warehouse

  • Repaso T-SQL. DML, DDL.
  • Patrones de Ingesta de datos (CDC, Delta ingestion, Full
    ingestion).
  • Optimización del rendimiento del almacenamiento (Indexing,
    particionado, bucketing, design by query, clustering).
  • Introducción a SQL Server Integration Services (SSIS).
  • Implementación de la capa Stage en SQL Server.
  • Implementación de la capa Operational Data Store (ODS) en SQL
    Server.
  • Implementación de la capa Business Data Store (BDS) en SQL
    Server.
  • Implementación de scripts T-SQL para poblar el Data
    Warehouse.
  • Automatización de paquetes mediante Jobs.

Cloud BI

  • Fundamentos de Cloud Computing. Modelos principales de
    servicios (SaaS, PaaS, IaaS, Serveless). Modelos de costos.
  • Arquitecturas de referencia de DWH en Cloud.
  • Plataformas de almacenamiento y procesamiento multicloud.
    (Snowflake, Dbt).
  • Taller: Implementación de una arquitectura DWH en Azure.
  • Taller: Implementación de una arquitectura DWH en GCP.
  • Taller: Implementación de una arquitectura DWH en AWS.
Data Governance & Quality Fundamentals

Data Governance Fundamentals

  • Gobernanza de datos. Qué, por qué en la organización.
  • Descripción general del modelo operativo de gobernanza de
    datos: Centralizado, Federado e Híbrido.
  • Conceptos generales del Comité de la Dirección General. Roles y
    funciones: Responsable de datos, Administrador de datos,
    propietario de datos, custodio de datos.
  • Data Lineage. Definición, técnicas y tipos.
  • Data Catalog & Business Glossary. Definición, importancia,
    componentes, desarrollo y mantenimiento.
  • Data Dictionary. Definición, importancia.
  • Data Quality. Definición y dimensiones (métricas).
  • Taller: Estimación de métricas de calidad de datos con Excel para
    diversos Datasets.

Evaluación de Madurez de Gobierno de datos

  • Taller: Elección del modelo operativo para un caso uso.
  • Taller: Revisión de áreas de conocimiento y niveles de madurez
    según DMBOK (Capítulo 15, sección 1.3).
  • Taller: Plantilla 1. Diagnóstico de brechas (actual vs. Esperado).
    GAP y técnicas de priorización.
  • Taller: Plantilla 2. Progreso de actividades por área de
    conocimiento.
  • Taller: Plantilla 3. Identificación y análisis de Stakeholders.
  • Taller: Plantilla 4. Planificación de proyectos por áreas de
    conocimiento priorizadas.
Data Security Fundamentals

Marco Normativo

  • Overview marcos normativos GDPR, CCPA, PCI DSS.
  • Overview ISO 8000 Data Quality, ISO 27001 Information Security
    Management.
  • Gestión de riesgos.
  • Taller: Diseño de un plan de seguridad de datos básico:
    Identificación de vulnerabilidades, análisis de riesgos y plan de
    contingencia.

Protección de datos en proyectos de datos

  • Encriptación simétrica, encriptación asimétrica,
    enmascaramiento de datos.
  • Algoritmos comunes de encriptación.
  • Encriptación vs Tokenización
  • Servicios cloud de almacenamiento de secretos y accesos de
    forma segura.
  • Taller: Diseño de políticas de seguridad de datos.
  • Taller: Uso de servicios cloud para almacenamiento de las
    credenciales
Proyecto de Ingeniería de Datos I

Sesión 1. Lineamientos generales

  • Presentación de formatos.
  • Lineamientos, sugerencias, buenas prácticas.

Sesión 2. Presentación de primer avance. Revisión y feedback

  • (I) Diseño de Data Roadmap Corporativo.
  • (II) Diseño del Data Warehouse.

Sesión 3. Presentación de segundo avance. Revisión y feedback

  • (III) Data Warehouse implementado.
    Sesión 4. Presentación final y sustentación
  • I + II + III
  • (IV) Plan de gobierno de datos (iniciativas).
  • (V) Plan de seguridad de datos (básico).
Storytelling &Communication Skills Máster

Storytelling

  • Storytelling. Definición, importancia en los negocios y en el
    trabajo con proyectos.
  • Principio, desarrollo y final de impacto.
  • Implicación de las emociones.

El arte de la persuasión

  • Comprensión de la audiencia.
  • Modelos de procesamiento de información
  • Los llamamientos motivacionales, reglas de interacciones
    humanas.
  • Comunicación auténtica. Claves verbales y no verbales.
  • Manejo de objeciones y defensa de propuestas.
  • Taller: Planteamiento y defensa de un proyecto de data science
    empleando técnicas de Storytelling y de persuasión
    comunicativa
Data Monetization Máster

Monetización de datos

  • Definición e importancia de la monetización de datos.
  • Estrategias de monetización externa.
  • Estrategias de monetización interna.

Valorización de proyectos de analítica

  • Enfoques para la valorización de proyectos de analítica.
  • Taller: Valorización basada en pilotos y experimentos.

Advanced topics with Python

Advanced Python I. Database Control

  • Repaso de principales librerías para procesamiento de datos.
  • ORM utilizando SQLAlchemy.
  • ETL con pandas y SQLAlchemy
  • Control de concurrencia, multiprocesamiento (Uso de
    ThreadPoolExecutor).
  • Taller: Construcción de un framework de procesamiento de
    datos.
  • Taller: Extraer datos de un API e insertarlos en una base de datos
    relacional.

Advanced Python II. Data Extraction with APIs

  • Fundamentos Web Scraping utilizando Selenium.
  • Cómo evitar las trampas en el proceso del Web Scraping
    (Ajustando encabezados, Manejo de cookies con JavaScript,
    Huellas dactilares TLS,Timing Is Everything).
  • Expresiones regulares.
  • Web Scraping in Parallel.
  • Web Scraping Proxies.
  • Taller: Obtener datos de un archivo PDF utilizando expresiones
    regulares.
  • Taller: Web Scraping a sitios web.

Advanced Python III. Proactive Data Cleaning

  • Anticipar problemas de limpieza de datos al importar datos
    tabulares a Pandas.
  • Anticipar problemas de limpieza de datos al trabajar con HTML,
    JSON
  • Identificación de valores faltantes y valores atípicos en
    subconjuntos de datos.
  • Uso de visualizaciones para la identificación de valores
    inesperados.
  • Taller: Limpieza e identificación de valores anómalos en un
    dataset.
Big Data Performance &Tuning (Apache Spark)

Apache Spark Fundamentals

  • Principales conceptos de Big Data.
  • Módulos de Apache Spark.
  • Dataframe API.
  • PySpark Functions.
  • Taller: Desarrollo de un ETL en Pyspark.

Apache Spark for Tunning and Performance

  • Reading Spark Query Plans.
  • Reading Spark DAGs.
  • Memory Management (Spark UI).
  • Executor Tuning – Cores & Memory.
  • Shuffle Partition Optimization.
  • Data Partitioning.
  • Bucketing.
  • Using Caching.
  • Solve Data Skew (With Salting Method ,Boadcast Joins).
  • Dynamic Partition Pruning.
  • Taller: Optimización de un proceso ETL con Pyspark.
Data Engineering on Azure

Databricks Platform

  • Databricks Fundamentals.
  • Explorando Delta Lake en Azure Databricks.
  • Procesamiento del Data Lakehouse (Bronze, Silver and Gold).
  • Creación de Data Catalog (Database,Tables).
  • Integraciones de DevOps e implementación de CI/CD para Azure
    Databricks.
  • Taller: Poblando un Data Lakehouse.
  • Taller: Creación de la taxonomía en el Workspace.
  • Taller: Creación de Catalog en Databricks.
  • Taller: Crear y programar la ejecución del Pipeline en Workflow.

Azure Data Engineering Services

  • Principales Servicios de Azure para Ingeniería de datos.
    Denominación y modelo de costos asociado.
  • Arquitecturas de referencia para procesamiento de Batch y Realtime en Azure.
  • Data Factory y Data Flow. Características generales, casos de
    uso.
  • Integración Data Factory con Azure Databricks.
  • Introducción a los servicios Azure Blob Storage y Storage
    Account.
  • Revisión de servicios: Azure EventHubs y IoTHub. Características
    generales, ejemplos de implementación y uso.
  • Azure SQL Database y CosmosDB. Descripción y características
    generales.
  • Azure Synapse Analytics. Propósito del servicio, características
    generales.
  • Fabric. Propósito del servicio, características generales.
  • Azure Devops, descripción y características generales.
  • Taller: Automatización del Pipeline del Data Lakehouse
    utilizando Azure Databricks y Data Factory.
  • Taller: Creación del Data Lakehouse en Azure Datalake Gen2.
  • Taller: Conexión de Power BI a servicios de datos de Azure.
Data Engineering on AWS

AWS Data Engineering Services

  • Principales Servicios de AWS para Ingeniería de datos.
  • Arquitecturas de referencia para procesamiento de Batch y Realtime en AWS.
  • Introducción a los servicios Glue y Databrew. Características
    generales, casos de uso.
  • El servicio S3 y seguridad en Buckets.
  • Amazon RDS (Relational Database Service). Propósito del
    servicio, características generales.
  • Amazon Athena. Propósito del servicio, características generales.
  • Amazon Quicksight. Propósito del servicio, características
    generales.
  • Taller: Implementación de un ETL Básico con Glue.
  • Taller: Implementación de un Datalake en AWS.
  • Taller: Creación de un bucket y carga de archivos utilizando el
    SDK de AWS (boto3).
Data Engineering on GCP

GCP Data Engineering Services

  • Principales Servicios de GCP para Ingeniería de datos
  • Arquitecturas de referencia para procesamiento de Batch y Realtime en GCP.
  • Introducción al servicio CloudFusion. Características generales,
    casos de uso.
  • El servicio Google Storage y la gestión de la seguridad.
  • Revisión del servicio Cloud PubSub. Características generales,
    ejemplos de implementación y uso.
  • BigQuery. Propósito del servicio, características generales.
  • Cloud Funtions. Propósito del servicio, características generales.
  • Taller: Creación de la estructura de un Data lake en Cloud
    Storage.
  • Taller: Implementación de un ETL Básico con CloudFusion.
  • Taller: Creación de una arquitectura Real time en GCP.
Data Orchestration on Cloud(Apache Airflow)

Apache Airflow on Cloud

  • Apache Airflow. Definición.
  • DAG (Direct-Acyclic-Graph). Definición y casos de uso.
  • Uso de Scheduler.
  • Task and Operator.
  • Bash Operator,Python Operator y Apache Spark Operators.
  • Taller: Implementado un DAG.
  • Taller: Procesamiento de datos con Apache Airflow en AWS.
  • Taller: Procesamiento de datos con Apache Airflow en GCP.
  • Taller: Procesamiento de datos con Apache Airflow en Azure.
DataOps Máster

Fundamentos de DataOps

  • DataOps. Definición y características.
  • Devops vs DataOps.
  • Conceptos asociados: Continuos-Delivery (CD) y ContinuosIntegrations (CI).
  • Servicios de automatización de despliegue: Jenkins, Azure
    Devops, Github Actions, Gitlab CI).
  • Fundamentos de Infraestructura como código. Definición y
    características de Terrraform.

Git and GitHub Actions

  • El control de versiones. Definición y características.
  • Git. Definición, principales comandos.
  • GitHub. Definición.
    Brief
    Master Internacional en Data Engineering on Cloud (v.2024.1)
    [Área de Producto e Innovación]
  • Estrategias de desarrollo colaborativo.
  • Taller: Aplicando Gitflow a nuestro proyecto en Github y
    Desplegando nuestro código en un servidor cloud.
Proyecto de Ingeniería de Datos II

Sesión 1. Presentación de primer avance. Revisión y feedback

  • (I) Solución Scraping.
  • (II) Procesamiento Spark.
  • (III.a) Solución Azure.

Sesión 2. Presentación de segundo avance. Revisión y feedback

  • (III.b) Solución AWS.
  • (III.c) Solución GCP.

Sesión 3. Presentación de tercer avance. Revisión y feedback

  • (IV) Automatización de flujos (en la nube elegida para el
    proyecto).
  • (V) Plan de costos.

Sesión 4. Presentación final y sustentación

  • (I) + (II) + (III)+ (IV) + (V)
  • (VI) Publicación del proyecto en GitHub y GitFlow.

Malla Curricular

Data-team Leadership
Data Strategy Plan Máster
Data Architecture &Modeling Fundamentals Máster
Advanced Data Warehousing(SQLSERVER, SSIS)
Data Governance & Quality Fundamentals
Data Security Fundamentals
Proyecto de Ingeniería de Datos I
Storytelling &Communication Skills Máster
Data Monetization Máster
Advanced topics with Python
Big Data Performance &Tuning (Apache Spark)
Data Engineering on Azure
Data Engineering on AWS
Data Engineering on GCP
Data Orchestration on Cloud(Apache Airflow)
DataOps Máster
Proyecto de Ingeniería de Datos II

Preguntas Frecuentes

Talvez su consulta se puede resolver leyendo nuestras preguntas frecuentes
Primeros pasos en la plataforma

2 artículos

¿Necesito tener una cuenta para poder matricularme en una capacitación?

Lo ideal es crear una cuenta en nuestra web y luego realizar tu compra, pero no es mandatorio. Si desea puede pagar y matricularse en cualquiera de nuestras capacitaciones y después de la compra, automáticamente se le habrá creado un usuario.

Ya me matriculé, ¿cuáles son los siguientes pasos?

Una vez matriculado en una de nuestras capacitaciones, le llegará un correo de confirmación con los accesos. De tener algún inconveniente deberá escribir a: esmeralda.verde@dmc.pe para recibir orientación y pronta solución.

Capacitaciones - Cursos - Especializaciones

1 artículos

¿Todos los cursos son 100% en vivo y online?

Sí, a menos que hayas comprado alguna membresía de DMC Play; todos nuestras capacitaciones: cursos, bootcamps, especializaciones, diplomas y lo incluido en nuestras Membresías DataPro son completamente online y 100% en vivo.

Resolución de problemas

1 artículos

No puedo ingresar a la plataforma, rechaza mi contraseña y usuario

Para cualquier problema con el usuario y contraseña de la plataforma deberás contactarte al siguiente correo y solicitar la solución: noel.yzaguirre@dmc.pe

Inscripciones - pagos - membresías

2 artículos

Tengo dudas y necesito ayuda con mi Membresía DataPro

Para recibir ayuda sobre el uso, acceso y aprovechamiento de tu Membresía DataPro, podrás escribirle a nuestra asesora: claudia.trujillo@dmc.pe, y ella podrá ayudarte con tus dudas.

Ya me inscribí en una Membresía DataPro, ¿qué sigue?

Deberás armar tu horario de estudios para que puedas aprovechar al máximo la membresía. Los accesos llegarán a tu correo electrónico y podrás así completar tus inscripciones. Recuerda revisar a qué tienen acceso según tu membresía adquirida.

Obtenga una certificación reconocida por las empresas y la industria nacional y extranjera

Utilice su certificación para realizar un cambio de vida hacia la ciencia de la Data y la Analítica o para mantenerse a la vanguardia en su carrera. Su salario se incrementará con sus conocimientos..

Miles de estudiantes satisfechos han logrado sus metas gracias a nuestra metodología de estudio

Abre tu cuenta GRATIS y aprovecha todo el contenido que tenemos para ti y empieza ahora a darle un nuevo impulso a tu carrera profesional.

Crea una cuenta gratis

¿Tienes alguna consulta o inquietud? talvez deseas consultar a uno de nuestros asesores

Hablar con un asesor

CONTINÚA TU CARRERA EN DATOS

Si finalizaste la capacitación en este perfil, te recomendamos algunos cursos para que continues tu carrera en el fascinante mundo de los datos.
Cursos

EXCEL INTERMEDIO

Entre las múltiples aplicaciones que ofrece Ms. Excel, está la de emplearlo para gestión del ciclo de…
Inicio:
26/10/2024
Online, 100% en vivo
3 - Sesiones
Certificación
60% Dto.

El precio original era: $81.00.El precio actual es: $32.40.

EspecializacionesEspecialista en Data Product Manager

Especialización en Data Product Management

Los proyectos de datos en general han cobrado relevancia en las organizaciones y empresas por su aporte…
Inicio:
22/10/2024
Online, 100% en vivo
12 - Sesiones
Certificación
30% Dto.

El precio original era: $807.30.El precio actual es: $565.11.

Máster

Máster Internacional en Data Engineering on Cloud

Dictado por docentes lideres
ESPECIALISTAS CALIFICADOS
El uso y explotación de los datos es transversal a las áreas o puestos de trabajo de…
Inicio:
27/11/2024
Online, 100% en vivo
72 - Sesiones
Certificación
30% Dto.

El precio original era: $4,317.30.El precio actual es: $3,022.11.

Cursos

EXCEL AVANZADO

Aunque Ms. Excel permite realizar una gran cantidad de trabajos y puede emplearse para diversos propósitos en…
Inicio:
02/10/2024
Online, 100% en vivo
5 - Sesiones
Certificación
60% Dto.

El precio original era: $81.00.El precio actual es: $32.40.