Recursos

Los alumnos del Máster en Data Science utlizarán recursos tecnológicos de última generación para la realización de ejercicios, prácticas de laboratorio, así como proyectos prácticos (incluido el Trabajo Fin de Máster). Esto les permitirá adquirir experiencia con muchas de las herramientas utilizadas en la actualidad para la práctica de la ciencia de datos.

Desarrollo de software

  • Gestión de proyectos en GitHub.
  • Programación científica en Python. con Anaconda.
  • Estadística computacional con R y RStudio.
  • Reproducibilidad: Jupyter, RMarkdown.

Procesamiento distribuido

  •   Arquitectura de referencia: Apache Spark.
    • Spark core.
    • Spark SQL: Dataframes, datasets.
    • Machine learning: ML/MLlib, H20.
    • Spark Streaming, Structured Streaming.
  •   Apache Hadoop.
    • MapReduce.
    • HDFS, Hive, NiFi.
    • Distribución Cloudera.

Cloud y almacenamiento

  • Microsoft Azure (HDInsight).
  • Amazon Web Services.
  • Bases de datos híbridas y no convencionales.
    • Redis.
    • MongoDB.
    • Cassandra.

Análisis estadístico

  • Programación científica en Python.
    • NumPy, SciPy, Matplotlib.
    • Pandas, Seaborn.
    • Scikit-learn, TensorFlow.
  • Estadística computacional con R.
    • RStudio.
    • Paquetes CRAN.
    • Sparklyr.

Visualización de datos

  • Visualización.
    • Tableau.
    • D3, Plotly, Highcharts.
  • Redes y grafos (Gephi).
  • Visualización en Python (Bokeh).
  • Visualización en R (ggplot2, Shiny, Leaflet).