Descripción
En el contexto de la Cuarta Revolución Industrial, el análisis de datos es crucial para liderar la transformación digital en las organizaciones. Este diplomado te capacita en herramientas especializadas de gobernanza de datos, machine learning y deep learning, permitiéndote identificar patrones y aplicar técnicas predictivas. Además, aprenderás storytelling con datos, una habilidad esencial para comunicar resultados y generar valor estratégico en la toma de decisiones empresariales. Prepárate para liderar en un entorno competitivo y digitalmente avanzado.
Certificación
Al final del diplomado, los y las participantes recibirán un certificado con el nombre institucional del programa: Diplomado en Ciencia de Datos
Objetivos
Desarrollar estrategias de gestión y análisis de datos a través de herramientas tecnológicas especializadas.
Orientado
Dirigido a líderes y analistas de datos, ingenieros y científicos de datos, y profesionales de áreas como finanzas, logística y marketing. Ideal para quienes buscan especializarse en el análisis de datos y liderar proyectos en entornos altamente competitivos.
Unidad i: Fundamentos de datos y procesos empresariales
- Introducción a la gobernanza de datos:
- Definición e Importancia de la gobernanza de datos en las organizaciones.
- Calidad de datos:
- Concepto y dimensiones de la calidad.
- Métodos para evaluar y mejorar la calidad.
- Seguridad de los datos:
- Fundamentos de seguridad de datos.
- Amenazas y riesgos de seguridad.
- Medidas de seguridad y buenas prácticas.
- Ética y regulaciones de la gestión de datos:
- Cumplimiento y regulaciones.
- Implicaciones legales y ética en la gestión de datos.
- Tecnologías en la gobernanza de datos:
- Mejores prácticas en gestión de datos.
- Consideraciones sobre la privacidad y confidencialidad.
Unidad I: Análisis Estadístico Descriptivo en Python
- Introducción a Google Colab:
- Ambiente de trabajo y características de Google Colab.
- Creación y manejo básico de notebooks.
- Limpieza y Preparación de Datos:
- Detección y manejo de datos faltantes.
- Manejo de datos atípicos.
- Transformación y normalización de datos.
- Estadísticas Básicas y Visualización de Datos:
- Medidas de tendencia central, dispersión y forma.
- Representaciones gráficas básicas con Matplotlib y Seaborn.
- Análisis Multivariante Introductorio:
- Concepto de correlación y covarianza. Introducción al análisis de componentes principales.
- Aplicación en Python con pandas y Numpy:
- Exploración de datasets.
- Cálculos estadísticos básicos y visualización
Unidad II: Análisis Estadístico Inferencial en Python
- Introducción al Análisis Inferencial:
- Diferencias entre estadística descriptiva e inferencial.
- Concepto de población y muestra.
- Variable aleatoria.
- Distribuciones de muestreo y teorema del límite central.
- Intervalos de Confianza:
- Concepto y cálculo de intervalos de confianza para medias.
- Pruebas de Hipótesis:
- Introducción a las pruebas de hipótesis.
- Pruebas para una muestra (t-test)
- Análisis de Regresión Simple:
- Conceptos básicos de regresión lineal.
- Evaluación del ajuste del modelo y predicción.
- Aplicación en Python con Statsmodels:
- Construcción y evaluación de modelos.
- Interpretación de resultados.
Unidad I: Técnicas para la exploración y preparación de datos.
- Análisis exploratorio de datos y uso de Jupyter Notebook mediante Google Colab.
- Librerías:
- Numpy.
- Pandas.
- Scikit-Learn.
- Procesos de Limpieza de datos: lectura de datos desde archivo y desde URL externa.
- Visualizaciones básicas de un DataFrame.
Unidad II: Técnicas de predicción de datos con Machine Learning
- Algoritmos de aprendizaje supervisado:
- Técnicas de clasificación:
- Regresión logística.
- Métodos basados en árboles.
- Support Vector Machine.
- Técnicas de regresión:
– Regresión lineal.
– Métodos basados en árboles.
– Support Vector Machine.
- Algoritmos de aprendizaje no supervisado:
- Análisis de conglomerados para datos numéricos, categóricos y mixtos.
- Reducción de dimensionalidad para datos numéricos.
- Uso de Python para realizar estos algoritmos.
Unidad I: Bases del Deep Learning: cimientos de la IA
- El perceptrón como unidad básica de las redes neuronales.
- Regresores naturales y las básicas MultiLayerPerceptron (MLP).
- Algoritmos como el descenso del gradiente y sus variantes.
- Retropropagación del error.
- Técnicas de generalización.
- Funciones de activación y regularización.
Unidad II: Aplicaciones del Deep Learning: pongamos a trabajar algunas arquitecturas de red neuronal
- La convolución y el residuo, desde la arquitectura ResNet.
- Clasificación de imágenes y arquitecturas como LSTM y transformer para procesos de Natural Language processing, usando la clasificación de sentimientos en texto como escenario
Unidad I: Técnicas para la visualización de datos
- ¿A qué nos referimos cuando hablamos de Storytelling?
- Elementos claves del Storytelling.
- Establecer estrategias de Storytelling según la audiencia.
- Selección de datos útiles.
- Eliminación de la sobrecarga.
- Visualización según tipos de datos.
- Dirigir la atención.
- Elementos visuales claves.
Unidad II: Técnicas para la presentación creativa de datos
- Pasos para crear un Data Story.
- Uso de la narración para transmitir el mensaje a la audiencia.
- Técnicas de Storytelling.
- Diseño de la presentación.
Descuentos
- 30% Titulados Duoc UC
- 15% – 25% Ex-alumnos de Educación Continua
Métodos de Pago
- Débito o Crédito (Botón Webpay: 3 cuotas sin interés todos los bancos / Botón Paga con tu Banco: 6 cuotas sin interés Banco Santander)
- Transferencia
- Orden de Compra