Tratamiento de datos con Pandas
- La librería Pandas. Definición, casos de uso.
- Series y Dataframes. Diferencias, implementación, principales métodos.
- Lectura y escritura de Dataframes desde archivos externos (TXT, CSV, XLS, etc.)
- Selección y filtrado de Datasets.
- Agrupación de Datasets. Sentencias GROUPBY, AGG, PIVOT_TABLE.
- Combinación de Datasets, Combining y Merging.
- Extracción de muestras. Uso de SAMPLE.
Visualización de datos
- Las librerías Matplotlib y Seaborn. Definición, casos de uso, alcance de cada una.
- Gráficos estadísticos básicos. Creación y configuración.
- Superposición de gráficas y subplots.
- Introducción a los gráficos interactivos con Python.
Análisis estadísticos de Datasets
- Identificación y tratamiento de valores perdidos en un Dataset.
- Identificación y tratamiento de valores atípicos (outliers) en un Dataset.
- Cálculo de medidas de tendencia central en un Dataset: Media, Mediana, Moda. Interpretación, casos de uso.
- Cálculo de medidas de posición en un Dataset: Percentiles, cuartiles y deciles. Interpretación, casos de uso.
- Cálculo de medidas de variabilidad en un Dataset: Desviación estándar, varianza y coeficiente de variabilidad. Interpretación, casos de uso.