Incluye uso de librerías como Numpy, Pandas, Matplotlib, Seaborn, Scikit-Learn.
Uso de Herramientas Big Data como Pyspark y SparkSQL en Databricks.
Incluye Acreditación de Competencias mediante Insignia Digital (emite UdeCataluña y Acreditta).
Mejora tus competencias con UdeCataluña
Muchas organizaciones aún no conocen el poder de los datos y el enorme potencial que tienen estos en la toma de decisiones, gracias al sorprendente desarrollo de la computación, hoy disponemos de la capacidad de procesar grandes volúmenes de información ofreciendo una nueva visión de la realidad en términos de patrones, tendencias o asociaciones; especialmente en lo relacionado con el comportamiento de los individuos y sus interacciones. Este conocimiento es el objeto de formación en nuestro programa de Big Data y Data Science.
Actualmente los profesionales de Big Data son ampliamente solicitados; están llamados a liderar la transformación del sector empresarial aplicando el potencial de estas nuevas tecnologías.
Metodología
Formación 100% virtual, con enfoque constructivista que permite al estudiante ser protagonista de su aprendizaje. Nuestro esquema de Aula Invertida permite que el estudiante adquiera el conocimiento a su ritmo, para desarrollar aspectos prácticos bajo la orientación de los conferencistas expertos en las Clases Presenciales Virtuales. El proceso se complementa con talleres, foros, pruebas formativas, actividades de retroalimentación y asesorías para garantizar un completo aprendizaje.
Dirigido a
Profesionales en Estadística, Economía, Administración de Empresas, Matemáticas, Ingenierías o que cuenten con capacidades básicas en métodos cuantitativos o experiencia laboral en ámbitos donde el manejo de datos se convierte en información estratégica.
Objetivos
Ofrecer al estudiante una aproximación global y práctica de Big Data, en el cual se afiancen los conocimientos necesarios en el análisis y gestión de datos para su comprensión, así como las herramientas y estrategias que le permitan entender y rentabilizar el uso de Big Data.
Comprender las perspectivas a nivel económico y tecnológico en soluciones de Big Data.
Adquirir conocimientos sobre las diferentes soluciones de análisis para obtener beneficios en cualquier entorno empresarial.
Plan de Estudios
Módulo 1: Introducción a Data Science y Big Data
Datos, información y conocimiento en la toma de decisiones.
Introducción y conceptualización de Big Data.
Las Vs de Big Data.
Roles y habilidades técnicas en el análisis de datos.
Diferencias entre Big Data y Data Science.
Machine Learning e Inteligencia Artificial.
Taller práctico - Recolección de datos.
Módulo 2: Introducción a la Programación con Python
Introducción a Google Colaboratory.
Variables y tipos de objetos.
Operadores lógicos y de comparación.
Condicionales y funciones.
Bucles o iteradores.
Estructuras de datos.
Carga de archivos.
Introducción a Markdown.
Retos prácticos de programación.
Módulo 3: Análisis Descriptivo y Exploratorio
Manejo de data frames con Pandas.
Medidas de tendencia central, de posición o localización.
Introducción a la visualización de datos con Matplotlib y Seaborn.
Análisis de tendencias y correlación.
Introducción a Power BI Pro.
Taller práctico – Exploración y visualización de datos.
Módulo 4: Limpieza y Transformación con Python
Detección y corrección de errores, valores faltantes y valores atípicos.
Transformación de variables: normalizar, escalar, numerizar y/o discretizar.
Módulo 5: Machine Learning con Scikit-Learn
Concepto de Machine Learning y técnicas de aprendizaje computacional.
Tipos de aprendizaje computacional:aprendizaje supervisado y no supervisado.
Tipos de problemas computacionales: regresión, clasificación y agrupamiento.
Algoritmos de Machine Learning.
Vecinos más cercanos.
Árboles de decisión y bosque aleatorio.
Regresión lineal y logística.
Redes neuronales artificiales.
Taller práctico – Aprendizaje computacional y evaluación de modelos.
Módulo 6: Arquitectura y Herramientas Big Data - Spark y Mongo DB
Arquitectura relacional – Introducción a SQL.
Taller práctico de SQL.
Ecosistema Big Data.
Almacenamiento Big Data – Tecnologías NO-SQL.
Taller práctico de MongoDB.
Procesamiento Big Data - Apache Spark.
Taller práctico de Spark.
Módulo 7: Herramientas Complementarias - Reproducibilidad y Agilismo
Reproducibilidad y Técnicas de Implementación.
Pilares del agilismo y metodología SCRUM.
Solicita más Información
Información General
Duración: 16 Semanas
Dedicación de 8/10 horas por semana
Incluye uso de librerías como Numpy, Pandas, Matplotlib, Seaborn, Scikit-Learn.
Uso de Herramientas Big Data como Pyspark y SparkSQL en Databricks.
Incluye Acreditación de Competencias mediante Insignia Digital (emite UdeCataluña y Acreditta).
Información Adicional
Titulación: Diplomado Big Data - Data Science con Python
Orientación de un proyecto de analítica avanzada a través de la metodología CRISP-DM.
Incluye uso de Inteligencia Artificial Generativa como herramienta de productividad en la explotación de Big Data y caso de uso de Prompt Engineering en Ciencia de Datos.
Domina los conceptos básicos de programación necesarios para el análisis de datos empleando Python.
Incluye curso complementario autoformativo a elección, según la oferta académica de la universidad