ESP. EN BIG DATA - DMC Perú
Productos
Crear una cuenta

CAPACITACIONES

Alianzas que respaldan nuestro trabajo

ESP. EN BIG DATA

El término Big Data, tan popularizado en los últimos años, hace alusión tanto a la magnitud de los datos que representa como a la tecnología que la soporta. La literatura la describe a partir de un conjunto de cualidades denominadas las “V’s del Big Data”, y, aunque es variable la cantidad de ellas respecto a cada autor, tres son transversales: Volumen, Velocidad y Variedad. En esa línea, las empresas que vienen adoptando Big Data, requieren de profesionales que puedan afrontar y solucionar los retos asociados, en primer lugar mantener el ritmo de crecimiento de los datos y su almacenamiento eficiente, luego encontrar técnicas para su procesamiento y organización de tal modo que pueda realizarse análisis significativos para el negocio, y finalmente mantener y emplear tecnología tanto tradicional como nueva.

Por ello, DMC Perú presenta la “Especialización en Big Data”, la cual te permitirá conocer sus fundamentos, la arquitectura tecnológica subyacente, y sobre todo las herramientas y los lenguajes disponibles para la manipulación de los datos, tanto para entornos On-premise como cloud.

30% Dto.

El precio original era: $483.30.El precio actual es: $338.31.

Hablar con un asesor

Profesor: Juan Salinas

Senior Data Engineer en Encora, previamente ha tenido experiencia en Belcorp, Derco, Grupo El Comercio y Tekton Labs. MBA e Ingeniero Industrial por la Universidad Autónoma del Perú.

Inicio: 14/11/2024
Fin: 16/01/2025
Online, 100% en vivo
64 hrs. académicas
16 - Sesiones
Certificación

Características

Clases en Vivo
El 100% de las clases que se desarrollan en el curso son en vivo.
Plataforma E-Learning
Accede en cualquier momento a materiales complementarios: lecturas, videos, tutoriales, clases grabadas y más.
Asesoría Académica
Resuelve tus dudas con el asistente académico en línea.
Aprende Haciendo
Desarrolla casos con datos reales, incluso puedes proponer casos de tu propio sector.
Certificación
Con una nota mínima de 14 sobre 20 y una asistencia mínima del 80%
Soporte Técnico
Soporte Técnico Asistencia técnica permanente y acceso a máquinas virtuales de ser necesario.

Lo que vas a obtener con este curso

Pre-requisitos: Sólidos conocimientos de programación, de preferencia con lenguaje Python.

Objetivo General: Aprende sobre los fundamentos de Big Data, la arquitectura tecnológica que la soporta, las herramientas y los lenguajes disponibles para la manipulación de los datos, tanto para entornos On-premise como cloud, y sobre todo su integración con soluciones de ingeniería de datos.

Objetivos Específicos:

  •  Aprende sobre el almacenamiento distribuido y a utilizar diversas herramientas para la implementación de Data-Lakes y para el tratamiento de datos a gran escala en modos Batch y Real-Time, como son Apache Hive, Apache Spark, Databricks, y Apache Kafka.
  • Prende a utilizar los principales servicios de los proveedores cloud líderes en el mercado como Azure, GCP y AWS, para el diseño e implementación de ETL básicos.

Resumen del contenido:

  • Big Data Processing.
  • Cloud Data Engineering.
Malla Curricular:
Big Data Processing.

Introducción a Big Data 

  • Big Data. Definición, filosofía, las Vs. 
  • Big Data como marco de trabajo. 
  • Arquitectura conceptual. 
  • Componentes tecnológicos disponibles. 
  • Arquitectura moderna de datos. 

 Almacenamiento distribuido con Apache Hadoop 

  • Tecnologías Open-source para Big Data. 
  • Fundamentos de Apache Hadoop. 
  • Almacenamiento distribuido en HDFS. 
  • Taller: Procesamiento de datos con Apache Hive. 
  • Diferencias de Map Reduce vs Tez vs Apache Spark. 
  • Datalake. Definición y arquitectura (capas). 
  • Taller: Poblamiento de un Datalake con Apache Tez, Apache Hive y HDFS. 

 Procesamiento distribuido con Apache Spark 

  • Introducción a Spark. 
  • Funciones con PySpark. 
  • Extracción y Transformación de datos. 
  • Dataframes y RDDs. 
  • Funciones de Apache Spark. 
  • Tunning en Apache Spark. 

 Ingeniería de datos con Databricks 

  • ¿Qué es Databricks? 
  • Databricks Community vs Azure Databricks. 
  • Conociendo la interfaz de Databricks. 
  • Data lakehouse vs Datalake. 
  • Iceberg vs Delta lake vs Apache Hudi. 
  • Taller: Creación de una Lakehouse con arquitectura Medallion con Delta Lake. 

 Real-time Fundamentals 

  • Real-time en datos. Definición, casos de aplicación, diferencias respecto a Batch. 
  • Arquitectura Publicador – Suscriptor. 
  • Tecnología para carga Real-Time en Big Data. 
  • Taller: Uso y configuración de Apache Kafka para carga de datos Real-Time. 
  • Apache Spark & Kafka setup enviroments. 
  • Taller: Integración de Apache Spark con Apache Kafka para procesamiento de datos Real-time. 
Cloud Data Engineering.

Fundamentos de Cloud Computing 

  • ¿Qué es computación en la nube? 
  • Conceptos de virtualización, Uso bajo demanda, despligue escalable. 
  • Ventajas del cloud computing. 
  • Regiones y zonas de disponibilidad. 
  • Tipos de nubes. 
  • IAAS, PAAS y SAAS. 

 Introducción a la Ingeniería de datos con AWS 

  • Introducción a la Consola de AWS. 
  • Principales servicios de data en AWS. S3, EMR, Cloud Funtions, IAM, Redshift, Athena, entre otros. 
  • Arquitectura de datos en AWS. 
  • Taller: Diseño e implementación de un ETL básico con AWS. 

 Introducción a la Ingeniería de datos con Azure 

  • Introducción a la Consola de Azure. 
  • Principales servicios de data en Azure. Blob Storage, Data factory, Databricks, Synapse, Event Hub, Azure SQL. 
  • Arquitectura de datos en AZURE. 
  • Taller: Diseño e implementación de un ETL básico con Azure. 

 Introducción a la Ingeniería de datos con GCP 

  • Introducción a la Consola de Azure. 
  • Servicios principales servicios de data en GCP. Cloud functions, Cloud Storage, Bigquery, Dataproc, data fusion, composer. 
  • Arquitectura de datos en GCP. 
  • Taller: Diseño e implementación de un ETL básico con GCP. 

Malla Curricular

Big Data Processing.
Cloud Data Engineering.

Preguntas Frecuentes

Talvez su consulta se puede resolver leyendo nuestras preguntas frecuentes
Primeros pasos en la plataforma

2 artículos

¿Necesito tener una cuenta para poder matricularme en una capacitación?

Lo ideal es crear una cuenta en nuestra web y luego realizar tu compra, pero no es mandatorio. Si desea puede pagar y matricularse en cualquiera de nuestras capacitaciones y después de la compra, automáticamente se le habrá creado un usuario.

Ya me matriculé, ¿cuáles son los siguientes pasos?

Una vez matriculado en una de nuestras capacitaciones, le llegará un correo de confirmación con los accesos. De tener algún inconveniente deberá escribir a: esmeralda.verde@dmc.pe para recibir orientación y pronta solución.

Capacitaciones - Cursos - Especializaciones

1 artículos

¿Todos los cursos son 100% en vivo y online?

Sí, a menos que hayas comprado alguna membresía de DMC Play; todos nuestras capacitaciones: cursos, bootcamps, especializaciones, diplomas y lo incluido en nuestras Membresías DataPro son completamente online y 100% en vivo.

Resolución de problemas

1 artículos

No puedo ingresar a la plataforma, rechaza mi contraseña y usuario

Para cualquier problema con el usuario y contraseña de la plataforma deberás contactarte al siguiente correo y solicitar la solución: noel.yzaguirre@dmc.pe

Inscripciones - pagos - membresías

2 artículos

Tengo dudas y necesito ayuda con mi Membresía DataPro

Para recibir ayuda sobre el uso, acceso y aprovechamiento de tu Membresía DataPro, podrás escribirle a nuestra asesora: claudia.trujillo@dmc.pe, y ella podrá ayudarte con tus dudas.

Ya me inscribí en una Membresía DataPro, ¿qué sigue?

Deberás armar tu horario de estudios para que puedas aprovechar al máximo la membresía. Los accesos llegarán a tu correo electrónico y podrás así completar tus inscripciones. Recuerda revisar a qué tienen acceso según tu membresía adquirida.

Obtenga una certificación reconocida por las empresas y la industria nacional y extranjera

Utilice su certificación para realizar un cambio de vida hacia la ciencia de la Data y la Analítica o para mantenerse a la vanguardia en su carrera. Su salario se incrementará con sus conocimientos..

Miles de estudiantes satisfechos han logrado sus metas gracias a nuestra metodología de estudio

Abre tu cuenta GRATIS y aprovecha todo el contenido que tenemos para ti y empieza ahora a darle un nuevo impulso a tu carrera profesional.

Crea una cuenta gratis

¿Tienes alguna consulta o inquietud? talvez deseas consultar a uno de nuestros asesores

Hablar con un asesor

CONTINÚA TU CARRERA EN DATOS

Si finalizaste la capacitación en este perfil, te recomendamos algunos cursos para que continues tu carrera en el fascinante mundo de los datos.
Cursos

EXCEL INTERMEDIO

Entre las múltiples aplicaciones que ofrece Ms. Excel, está la de emplearlo para gestión del ciclo de…
Inicio:
26/10/2024
Online, 100% en vivo
3 - Sesiones
Certificación
60% Dto.

El precio original era: $81.00.El precio actual es: $32.40.

EspecializacionesEspecialista en Data Product Manager

Especialización en Data Product Management

Los proyectos de datos en general han cobrado relevancia en las organizaciones y empresas por su aporte…
Inicio:
22/10/2024
Online, 100% en vivo
12 - Sesiones
Certificación
30% Dto.

El precio original era: $807.30.El precio actual es: $565.11.

Máster

Máster Internacional en Data Engineering on Cloud

Dictado por docentes lideres
ESPECIALISTAS CALIFICADOS
El uso y explotación de los datos es transversal a las áreas o puestos de trabajo de…
Inicio:
27/11/2024
Online, 100% en vivo
72 - Sesiones
Certificación
30% Dto.

El precio original era: $4,317.30.El precio actual es: $3,022.11.

Cursos

EXCEL AVANZADO

Aunque Ms. Excel permite realizar una gran cantidad de trabajos y puede emplearse para diversos propósitos en…
Inicio:
02/10/2024
Online, 100% en vivo
5 - Sesiones
Certificación
60% Dto.

El precio original era: $81.00.El precio actual es: $32.40.