El uso y explotación de los datos es transversal a las áreas o puestos de trabajo de una organización y la democratización de estos se ha vuelto crítica para la toma decisiones, el diseño de estrategias y la creación de ventaja competitiva. Frente a este panorama, la demanda de profesionales que estén en la capacidad de poner
los datos a disposición de todo aquel que lo necesite en la compañía y, sobre todo, a partir de soluciones basadas en las mejores alternativas tecnológicas, se ha vuelto indispensable.
CAPACITACIONES
Máster Internacional en Data Engineering on Cloud
El precio original era: $4,317.30.$3,022.11El precio actual es: $3,022.11.
Pre-requisitos:
Profesor: Leslie Lugo
Profesor: Isui Guzman
BI Reporting Leader Data & Analytics en
WALMART DE MÉXICO Y CENTROAMÉRICA
Profesor: Richard Quispe
Sub Gerente Adjunto Planning & Analytics GDHA en
BCP
Profesor: Gustavo Rangel
Head de iniciativas de IA y Cloud – Maypo
Profesor: Daniel Ayvar
Gerente de Gobierno de Datos en
MIBANCO
Profesor: Shirley Villacorta
Senior Associate en PwC Perú. Magíster en auditoría y Ejecutivo Senior. Más de 14 años de experiencia realizando auditoría de sistemas, ciberseguridad y seguridad de la información para diversos sectores. Cuenta con las certificaciones CISA, ISO 27032 Lead Cybersecurity Manager, Lead Cybersecurity Professional Certificate, ISO 27001 y OKR Certified Professional.
Profesor: Juan Salinas
Senior Data Engineer en Encora, previamente ha tenido experiencia en Belcorp, Derco, Grupo El Comercio y Tekton Labs. MBA e Ingeniero Industrial por la Universidad Autónoma del Perú.
Profesor: Daniela Gonzalez
Profesor: Jorge Bustamante
Profesor: Dennys Rafael
Gerente de Valor y Portafolio Data Analytics en
ALICORP
Profesor: Guillermo Acha
Profesor: Christian Sanchez
Senior Data Engineer en
PACÍFICO SEGUROS
Profesor: Anita Quevedo
Cloud Partner Engineer en
GOOGLE
Profesor: Miguel Garcia
Especialista en TI en E2E
Características
Clases en Vivo
Plataforma E-Learning
Asesoría Académica
Aprende Haciendo
Certificación
Soporte Técnico
Lo que vas a obtener con este curso
Objetivo General:
Aprende a desarrollar proyectos de ingeniería de datos con enfoque en negocios, considerando tanto soluciones para datos relacionales mediante Data Warehouses robustos, así como aquellas para datos mixtos mediante Data Lakes y servicios nube que garanticen la democratización de los datos y la continuidad del negocio.
Objetivos Específicos:
- Aprende a descubrir el líder que existe en ti, a cómo generar engagement de equipos y a liderarlos para obtener el máximo
rendimiento, ya sea con orientación a equipos de datos o a cualquier otro que toque liderar. - Aprende a plantear una estrategia de datos alineada a los grandes objetivos corporativos y a plasmarla en un roadmap, empleando en el proceso diversos artefactos y herramientas.
- Aprende a diseñar arquitecturas de datos, tanto desde una perspectiva holística que contemple el flujo y control de Big Data, tecnología ETL y ELT, Data lake, entre otros. Así como a nivel específico, a través del modelamiento de bases OLTP y su transición hacía OLAP.
- Aprende a implementar un Data Warehouse multicapa en SQL Server, empleando de manera complementaria su herramienta SQL Server Integration Services (SSIS) para el diseño y puesta en funcionamiento
de procesos ETL para poblarlo. Finalmente, revisa servicios cloud para el despliegue y uso inmediato de Data Warehouses corporativos (Platform as a Service), como Snowflake, Dbt, y otros exclusivos de Azure, AWS y GCP. - Aprende sobre el gobierno de datos, sus principales conceptos y artefactos aplicables el contexto de Data Engineering, como catálogos y diccionarios, linaje, calidad de datos, etc, mientras aplicas el marco de trabajo DMBOK para el diagnóstico de madurez a un caso de uso y la propuesta de un plan de acción.
- Aprende sobre los diferentes marcos normativos aplicables a la seguridad y calidad de datos como las normas ISO 27000 e ISO 8000. Así como a aplicar técnicas de encriptación y tokenización para proteger los datos en los proyectos de ingeniería de datos.
- Aprende a planificar, diseñar e implementar un proyecto Data Warehouse que soporte proyectos actuales y futuros de datos (Data Roadmap), acorde a los planes organizacionales.
Malla Curricular:
Data-team Leadership
- Me conozco. Autoconocimiento y descubrimiento del líder que hay en mí.
- Colaboro. Engagement de equipos.
- Lidero. Escucho, inspiro y guío.
Data Strategy Plan Máster
Estrategia de datos
- Definición, enfoque e impacto en las organizaciones.
- Roles en equipos de data y analytics.
- Artefactos para el diseño de una estrategia de datos.
- Recomendaciones y buenas prácticas en el diseño de una
estrategia de datos. - Taller: Diseño del roadmap de una estrategia de datos
Data Architecture &Modeling Fundamentals Máster
Data Engineering Lifecycle
- Evolución de la Ingeniería de datos.
- ETL vs ELT.
- Arquitectura de una solución BI.
- Modelos Multidimensionales.
- Tecnologías Data Storage y Data Process.
- Taller: Desarrollo de un diagrama de una arquitectura BI.
Modern Data Architecture
- Arquitectura de una solución Big Data.
- Taxonomía del Datalake.
- Tecnologías y servicios relacionados a la arquitectura moderna
de datos. - Arquitecturas de referencia.
- Taller: Desarrollo de un diagrama de una arquitectura moderna
de datos.
Data Modeler Fundamentals
- Tipos de modelos de datos.
- Modelo Conceptual, físico y lógico.
- Fundamentos de normalización.
- Cardinalidad.
- OLTP vs OLAP.
- Taller: Creación de un diagrama de Modelo lógico.
Data Modeler Dimensional
- Modelos dimensionas (Star Schema y Snowflake Schema).
- Modelamiento del Data warehouse.
- Modelamiento del Data lakehouse.
- Diseño de dimensiones (SCD).
- Taller: Diseño de un modelo OLAP a partir de uno OLTP.
Advanced Data Warehousing(SQLSERVER, SSIS)
Traditional Data Warehouse
- Repaso T-SQL. DML, DDL.
- Patrones de Ingesta de datos (CDC, Delta ingestion, Full
ingestion). - Optimización del rendimiento del almacenamiento (Indexing,
particionado, bucketing, design by query, clustering). - Introducción a SQL Server Integration Services (SSIS).
- Implementación de la capa Stage en SQL Server.
- Implementación de la capa Operational Data Store (ODS) en SQL
Server. - Implementación de la capa Business Data Store (BDS) en SQL
Server. - Implementación de scripts T-SQL para poblar el Data
Warehouse. - Automatización de paquetes mediante Jobs.
Cloud BI
- Fundamentos de Cloud Computing. Modelos principales de
servicios (SaaS, PaaS, IaaS, Serveless). Modelos de costos. - Arquitecturas de referencia de DWH en Cloud.
- Plataformas de almacenamiento y procesamiento multicloud.
(Snowflake, Dbt). - Taller: Implementación de una arquitectura DWH en Azure.
- Taller: Implementación de una arquitectura DWH en GCP.
- Taller: Implementación de una arquitectura DWH en AWS.
Data Governance & Quality Fundamentals
Data Governance Fundamentals
- Gobernanza de datos. Qué, por qué en la organización.
- Descripción general del modelo operativo de gobernanza de
datos: Centralizado, Federado e Híbrido. - Conceptos generales del Comité de la Dirección General. Roles y
funciones: Responsable de datos, Administrador de datos,
propietario de datos, custodio de datos. - Data Lineage. Definición, técnicas y tipos.
- Data Catalog & Business Glossary. Definición, importancia,
componentes, desarrollo y mantenimiento. - Data Dictionary. Definición, importancia.
- Data Quality. Definición y dimensiones (métricas).
- Taller: Estimación de métricas de calidad de datos con Excel para
diversos Datasets.
Evaluación de Madurez de Gobierno de datos
- Taller: Elección del modelo operativo para un caso uso.
- Taller: Revisión de áreas de conocimiento y niveles de madurez
según DMBOK (Capítulo 15, sección 1.3). - Taller: Plantilla 1. Diagnóstico de brechas (actual vs. Esperado).
GAP y técnicas de priorización. - Taller: Plantilla 2. Progreso de actividades por área de
conocimiento. - Taller: Plantilla 3. Identificación y análisis de Stakeholders.
- Taller: Plantilla 4. Planificación de proyectos por áreas de
conocimiento priorizadas.
Data Security Fundamentals
Marco Normativo
- Overview marcos normativos GDPR, CCPA, PCI DSS.
- Overview ISO 8000 Data Quality, ISO 27001 Information Security
Management. - Gestión de riesgos.
- Taller: Diseño de un plan de seguridad de datos básico:
Identificación de vulnerabilidades, análisis de riesgos y plan de
contingencia.
Protección de datos en proyectos de datos
- Encriptación simétrica, encriptación asimétrica,
enmascaramiento de datos. - Algoritmos comunes de encriptación.
- Encriptación vs Tokenización
- Servicios cloud de almacenamiento de secretos y accesos de
forma segura. - Taller: Diseño de políticas de seguridad de datos.
- Taller: Uso de servicios cloud para almacenamiento de las
credenciales
Proyecto de Ingeniería de Datos I
Sesión 1. Lineamientos generales
- Presentación de formatos.
- Lineamientos, sugerencias, buenas prácticas.
Sesión 2. Presentación de primer avance. Revisión y feedback
- (I) Diseño de Data Roadmap Corporativo.
- (II) Diseño del Data Warehouse.
Sesión 3. Presentación de segundo avance. Revisión y feedback
- (III) Data Warehouse implementado.
Sesión 4. Presentación final y sustentación - I + II + III
- (IV) Plan de gobierno de datos (iniciativas).
- (V) Plan de seguridad de datos (básico).
Storytelling &Communication Skills Máster
Storytelling
- Storytelling. Definición, importancia en los negocios y en el
trabajo con proyectos. - Principio, desarrollo y final de impacto.
- Implicación de las emociones.
El arte de la persuasión
- Comprensión de la audiencia.
- Modelos de procesamiento de información
- Los llamamientos motivacionales, reglas de interacciones
humanas. - Comunicación auténtica. Claves verbales y no verbales.
- Manejo de objeciones y defensa de propuestas.
- Taller: Planteamiento y defensa de un proyecto de data science
empleando técnicas de Storytelling y de persuasión
comunicativa
Data Monetization Máster
Monetización de datos
- Definición e importancia de la monetización de datos.
- Estrategias de monetización externa.
- Estrategias de monetización interna.
Valorización de proyectos de analítica
- Enfoques para la valorización de proyectos de analítica.
- Taller: Valorización basada en pilotos y experimentos.
Advanced topics with Python
Advanced Python I. Database Control
- Repaso de principales librerías para procesamiento de datos.
- ORM utilizando SQLAlchemy.
- ETL con pandas y SQLAlchemy
- Control de concurrencia, multiprocesamiento (Uso de
ThreadPoolExecutor). - Taller: Construcción de un framework de procesamiento de
datos. - Taller: Extraer datos de un API e insertarlos en una base de datos
relacional.
Advanced Python II. Data Extraction with APIs
- Fundamentos Web Scraping utilizando Selenium.
- Cómo evitar las trampas en el proceso del Web Scraping
(Ajustando encabezados, Manejo de cookies con JavaScript,
Huellas dactilares TLS,Timing Is Everything). - Expresiones regulares.
- Web Scraping in Parallel.
- Web Scraping Proxies.
- Taller: Obtener datos de un archivo PDF utilizando expresiones
regulares. - Taller: Web Scraping a sitios web.
Advanced Python III. Proactive Data Cleaning
- Anticipar problemas de limpieza de datos al importar datos
tabulares a Pandas. - Anticipar problemas de limpieza de datos al trabajar con HTML,
JSON - Identificación de valores faltantes y valores atípicos en
subconjuntos de datos. - Uso de visualizaciones para la identificación de valores
inesperados. - Taller: Limpieza e identificación de valores anómalos en un
dataset.
Big Data Performance &Tuning (Apache Spark)
Apache Spark Fundamentals
- Principales conceptos de Big Data.
- Módulos de Apache Spark.
- Dataframe API.
- PySpark Functions.
- Taller: Desarrollo de un ETL en Pyspark.
Apache Spark for Tunning and Performance
- Reading Spark Query Plans.
- Reading Spark DAGs.
- Memory Management (Spark UI).
- Executor Tuning – Cores & Memory.
- Shuffle Partition Optimization.
- Data Partitioning.
- Bucketing.
- Using Caching.
- Solve Data Skew (With Salting Method ,Boadcast Joins).
- Dynamic Partition Pruning.
- Taller: Optimización de un proceso ETL con Pyspark.
Data Engineering on Azure
Databricks Platform
- Databricks Fundamentals.
- Explorando Delta Lake en Azure Databricks.
- Procesamiento del Data Lakehouse (Bronze, Silver and Gold).
- Creación de Data Catalog (Database,Tables).
- Integraciones de DevOps e implementación de CI/CD para Azure
Databricks. - Taller: Poblando un Data Lakehouse.
- Taller: Creación de la taxonomía en el Workspace.
- Taller: Creación de Catalog en Databricks.
- Taller: Crear y programar la ejecución del Pipeline en Workflow.
Azure Data Engineering Services
- Principales Servicios de Azure para Ingeniería de datos.
Denominación y modelo de costos asociado. - Arquitecturas de referencia para procesamiento de Batch y Realtime en Azure.
- Data Factory y Data Flow. Características generales, casos de
uso. - Integración Data Factory con Azure Databricks.
- Introducción a los servicios Azure Blob Storage y Storage
Account. - Revisión de servicios: Azure EventHubs y IoTHub. Características
generales, ejemplos de implementación y uso. - Azure SQL Database y CosmosDB. Descripción y características
generales. - Azure Synapse Analytics. Propósito del servicio, características
generales. - Fabric. Propósito del servicio, características generales.
- Azure Devops, descripción y características generales.
- Taller: Automatización del Pipeline del Data Lakehouse
utilizando Azure Databricks y Data Factory. - Taller: Creación del Data Lakehouse en Azure Datalake Gen2.
- Taller: Conexión de Power BI a servicios de datos de Azure.
Data Engineering on AWS
AWS Data Engineering Services
- Principales Servicios de AWS para Ingeniería de datos.
- Arquitecturas de referencia para procesamiento de Batch y Realtime en AWS.
- Introducción a los servicios Glue y Databrew. Características
generales, casos de uso. - El servicio S3 y seguridad en Buckets.
- Amazon RDS (Relational Database Service). Propósito del
servicio, características generales. - Amazon Athena. Propósito del servicio, características generales.
- Amazon Quicksight. Propósito del servicio, características
generales. - Taller: Implementación de un ETL Básico con Glue.
- Taller: Implementación de un Datalake en AWS.
- Taller: Creación de un bucket y carga de archivos utilizando el
SDK de AWS (boto3).
Data Engineering on GCP
GCP Data Engineering Services
- Principales Servicios de GCP para Ingeniería de datos
- Arquitecturas de referencia para procesamiento de Batch y Realtime en GCP.
- Introducción al servicio CloudFusion. Características generales,
casos de uso. - El servicio Google Storage y la gestión de la seguridad.
- Revisión del servicio Cloud PubSub. Características generales,
ejemplos de implementación y uso. - BigQuery. Propósito del servicio, características generales.
- Cloud Funtions. Propósito del servicio, características generales.
- Taller: Creación de la estructura de un Data lake en Cloud
Storage. - Taller: Implementación de un ETL Básico con CloudFusion.
- Taller: Creación de una arquitectura Real time en GCP.
Data Orchestration on Cloud(Apache Airflow)
Apache Airflow on Cloud
- Apache Airflow. Definición.
- DAG (Direct-Acyclic-Graph). Definición y casos de uso.
- Uso de Scheduler.
- Task and Operator.
- Bash Operator,Python Operator y Apache Spark Operators.
- Taller: Implementado un DAG.
- Taller: Procesamiento de datos con Apache Airflow en AWS.
- Taller: Procesamiento de datos con Apache Airflow en GCP.
- Taller: Procesamiento de datos con Apache Airflow en Azure.
DataOps Máster
Fundamentos de DataOps
- DataOps. Definición y características.
- Devops vs DataOps.
- Conceptos asociados: Continuos-Delivery (CD) y ContinuosIntegrations (CI).
- Servicios de automatización de despliegue: Jenkins, Azure
Devops, Github Actions, Gitlab CI). - Fundamentos de Infraestructura como código. Definición y
características de Terrraform.
Git and GitHub Actions
- El control de versiones. Definición y características.
- Git. Definición, principales comandos.
- GitHub. Definición.
Brief
Master Internacional en Data Engineering on Cloud (v.2024.1)
[Área de Producto e Innovación] - Estrategias de desarrollo colaborativo.
- Taller: Aplicando Gitflow a nuestro proyecto en Github y
Desplegando nuestro código en un servidor cloud.
Proyecto de Ingeniería de Datos II
Sesión 1. Presentación de primer avance. Revisión y feedback
- (I) Solución Scraping.
- (II) Procesamiento Spark.
- (III.a) Solución Azure.
Sesión 2. Presentación de segundo avance. Revisión y feedback
- (III.b) Solución AWS.
- (III.c) Solución GCP.
Sesión 3. Presentación de tercer avance. Revisión y feedback
- (IV) Automatización de flujos (en la nube elegida para el
proyecto). - (V) Plan de costos.
Sesión 4. Presentación final y sustentación
- (I) + (II) + (III)+ (IV) + (V)
- (VI) Publicación del proyecto en GitHub y GitFlow.
Malla Curricular
Preguntas Frecuentes
Primeros pasos en la plataforma
2 artículos
¿Necesito tener una cuenta para poder matricularme en una capacitación?
Lo ideal es crear una cuenta en nuestra web y luego realizar tu compra, pero no es mandatorio. Si desea puede pagar y matricularse en cualquiera de nuestras capacitaciones y después de la compra, automáticamente se le habrá creado un usuario.
Ya me matriculé, ¿cuáles son los siguientes pasos?
Una vez matriculado en una de nuestras capacitaciones, le llegará un correo de confirmación con los accesos. De tener algún inconveniente deberá escribir a: esmeralda.verde@dmc.pe para recibir orientación y pronta solución.
Capacitaciones - Cursos - Especializaciones
1 artículos
¿Todos los cursos son 100% en vivo y online?
Sí, a menos que hayas comprado alguna membresía de DMC Play; todos nuestras capacitaciones: cursos, bootcamps, especializaciones, diplomas y lo incluido en nuestras Membresías DataPro son completamente online y 100% en vivo.
Resolución de problemas
1 artículos
No puedo ingresar a la plataforma, rechaza mi contraseña y usuario
Para cualquier problema con el usuario y contraseña de la plataforma deberás contactarte al siguiente correo y solicitar la solución: noel.yzaguirre@dmc.pe
Inscripciones - pagos - membresías
2 artículos
Tengo dudas y necesito ayuda con mi Membresía DataPro
Para recibir ayuda sobre el uso, acceso y aprovechamiento de tu Membresía DataPro, podrás escribirle a nuestra asesora: claudia.trujillo@dmc.pe, y ella podrá ayudarte con tus dudas.
Ya me inscribí en una Membresía DataPro, ¿qué sigue?
Deberás armar tu horario de estudios para que puedas aprovechar al máximo la membresía. Los accesos llegarán a tu correo electrónico y podrás así completar tus inscripciones. Recuerda revisar a qué tienen acceso según tu membresía adquirida.
Obtenga una certificación reconocida por las empresas y la industria nacional y extranjera
Miles de estudiantes satisfechos han logrado sus metas gracias a nuestra metodología de estudio
Abre tu cuenta GRATIS y aprovecha todo el contenido que tenemos para ti y empieza ahora a darle un nuevo impulso a tu carrera profesional.
¿Tienes alguna consulta o inquietud? talvez deseas consultar a uno de nuestros asesores
Hablar con un asesorCONTINÚA TU CARRERA EN DATOS
EXCEL INTERMEDIO
26/10/2024
El precio original era: $81.00.$32.40El precio actual es: $32.40.
Especialización en Data Product Management
22/10/2024
El precio original era: $807.30.$565.11El precio actual es: $565.11.
Máster Internacional en Data Engineering on Cloud
ESPECIALISTAS CALIFICADOS
27/11/2024
El precio original era: $4,317.30.$3,022.11El precio actual es: $3,022.11.
EXCEL AVANZADO
02/10/2024
El precio original era: $81.00.$32.40El precio actual es: $32.40.