Diplomado Big Data - Data Science con Python

Información General

  • Duración: 16 Semanas Dedicación de 8/10 horas por semana
  • Diplomado 100% Virtual Acompañamiento Académico + Encuentros Sincrónicos
  • Incluye uso de librerías como Numpy, Pandas, Matplotlib, Seaborn, Scikit-Learn.
  • Uso de Herramientas Big Data como Pyspark y SparkSQL en Databricks.
  • Incluye Acreditación de Competencias mediante Insignia Digital (emite UdeCataluña y Acreditta).

Mejora tus competencias con UdeCataluña

Muchas organizaciones aún no conocen el poder de los datos y el enorme potencial que tienen estos en la toma de decisiones, gracias al sorprendente desarrollo de la computación, hoy disponemos de la capacidad de procesar grandes volúmenes de información ofreciendo una nueva visión de la realidad en términos de patrones, tendencias o asociaciones; especialmente en lo relacionado con el comportamiento de los individuos y sus interacciones. Este conocimiento es el objeto de formación en nuestro programa de Big Data y Data Science.

Actualmente los profesionales de Big Data son ampliamente solicitados; están llamados a liderar la transformación del sector empresarial aplicando el potencial de estas nuevas tecnologías.

Metodología

Formación 100% virtual, con enfoque constructivista que permite al estudiante ser protagonista de su aprendizaje. Nuestro esquema de Aula Invertida permite que el estudiante adquiera el conocimiento a su ritmo, para desarrollar aspectos prácticos bajo la orientación de los conferencistas expertos en las Clases Presenciales Virtuales. El proceso se complementa con talleres, foros, pruebas formativas, actividades de retroalimentación y asesorías para garantizar un completo aprendizaje.

Dirigido a

Profesionales en Estadística, Economía, Administración de Empresas, Matemáticas, Ingenierías o que cuenten con capacidades básicas en métodos cuantitativos o experiencia laboral en ámbitos donde el manejo de datos se convierte en información estratégica.

Objetivos

  • Ofrecer al estudiante una aproximación global y práctica de Big Data, en el cual se afiancen los conocimientos necesarios en el análisis y gestión de datos para su comprensión, así como las herramientas y estrategias que le permitan entender y rentabilizar el uso de Big Data.
  • Comprender las perspectivas a nivel económico y tecnológico en soluciones de Big Data.
  • Adquirir conocimientos sobre las diferentes soluciones de análisis para obtener beneficios en cualquier entorno empresarial.

Plan de Estudios

  • Módulo 1: Introducción a Data Science y Big Data
    • Datos, información y conocimiento en la toma de decisiones.
    • Introducción y conceptualización de Big Data.
    • Las Vs de Big Data.
    • Roles y habilidades técnicas en el análisis de datos.
    • Diferencias entre Big Data y Data Science.
    • Machine Learning e Inteligencia Artificial.
    • Taller práctico - Recolección de datos.
  • Módulo 2: Introducción a la Programación con Python
    • Introducción a Google Colaboratory.
    • Variables y tipos de objetos.
    • Operadores lógicos y de comparación.
    • Condicionales y funciones.
    • Bucles o iteradores.
    • Estructuras de datos.
    • Carga de archivos.
    • Introducción a Markdown.
    • Retos prácticos de programación.
  • Módulo 3: Análisis Descriptivo y Exploratorio
    • Manejo de data frames con Pandas.
    • Medidas de tendencia central, de posición o localización.
    • Introducción a la visualización de datos con Matplotlib y Seaborn.
    • Análisis de tendencias y correlación.
    • Introducción a Power BI Pro.
    • Taller práctico – Exploración y visualización de datos.
  • Módulo 4: Limpieza y Transformación con Python
    • Detección y corrección de errores, valores faltantes y valores atípicos.
    • Transformación de variables: normalizar, escalar, numerizar y/o discretizar.
  • Módulo 5: Machine Learning con Scikit-Learn
    • Concepto de Machine Learning y técnicas de aprendizaje computacional.
    • Tipos de aprendizaje computacional:aprendizaje supervisado y no supervisado.
    • Tipos de problemas computacionales: regresión, clasificación y agrupamiento.
    • Algoritmos de Machine Learning.
    • Vecinos más cercanos.
    • Árboles de decisión y bosque aleatorio.
    • Regresión lineal y logística.
    • Redes neuronales artificiales.
    • Taller práctico – Aprendizaje computacional y evaluación de modelos.
  • Módulo 6: Arquitectura y Herramientas Big Data - Spark y Mongo DB
    • Arquitectura relacional – Introducción a SQL.
    • Taller práctico de SQL.
    • Ecosistema Big Data.
    • Almacenamiento Big Data – Tecnologías NO-SQL.
    • Taller práctico de MongoDB.
    • Procesamiento Big Data - Apache Spark.
    • Taller práctico de Spark.
  • Módulo 7: Herramientas Complementarias - Reproducibilidad y Agilismo
    • Reproducibilidad y Técnicas de Implementación.
    • Pilares del agilismo y metodología SCRUM.
Solicita más Información
Solicita más Información