Recursos

Los alumnos del Máster en Data Science utlizarán recursos tecnológicos de última generación para la realización de ejercicios, prácticas de laboratorio, así como proyectos prácticos (incluido el Trabajo Fin de Máster). Esto les permitirá adquirir experiencia con muchas de las herramientas utilizadas en la actualidad para la práctica de la ciencia de datos.

Desarrollo de software

  • Gestión de proyectos en GitHub.
  • Programación científica en Python. con Anaconda.
  • Estadística computacional con R.
  • Reproducibilidad: IPython, RMarkdown, Shiny.

Procesamiento distribuido

  •   Arquitectura de referencia: Apache Spark.
    • Spark core.
    • Spark SQL.
    • MLlib.
    • Spark Streaming.
  •   Apache Hadoop.
    • HDFS.
    • MapReduce.
    • Pig, Hive.

Cloud y almacenamiento

  • Microsoft Azure (HDInsight).
  • Amazon Web Services.
  • Bases de datos híbridas y no convencionales.
    • TokuDB/TokuMX.
    • Redis.
    • MongoDB.
    • Aerospike.

Análisis estadístico

  • Programación científica en Python.
    • NumPy, SciPy, Matplotlib.
    • Pandas.
    • Scikit-learn.
  • Estadística computacional con R.
    • RStudio.
    • Bibliotecas CRAN.
    • Computación distribuida y cloud con R.

Visualización de datos

  • Visualización web (JavaScript).
    • Tableau.
    • D3.
    • Plotly.
  • Redes y grafos (Gephi).
  • Visualización en Python (Bokeh).
  • Visualización en R (ggplot2).