Recursos
Los alumnos del Máster en Data Science utlizarán recursos tecnológicos de última
generación para la realización de ejercicios, prácticas de laboratorio, así como
proyectos prácticos (incluido el Trabajo Fin de Máster). Esto les permitirá adquirir
experiencia con muchas de las herramientas utilizadas en la actualidad para la práctica
de la ciencia de datos.
Desarrollo de software
-
Gestión de proyectos en GitHub.
-
Programación científica en Python.
con Anaconda.
-
Estadística computacional con R y RStudio.
-
Reproducibilidad: Jupyter, RMarkdown.
Procesamiento distribuido
-
Arquitectura de referencia: Apache Spark.
-
Spark core.
-
Spark SQL: Dataframes, datasets.
-
Machine learning: ML/MLlib, H20.
-
Spark Streaming, Structured Streaming.
-
Apache Hadoop.
-
MapReduce.
-
HDFS, Hive, NiFi.
-
Distribución Cloudera.
Cloud y almacenamiento
-
Microsoft Azure (HDInsight).
-
Amazon Web Services.
-
Bases de datos híbridas y no convencionales.
-
Redis.
-
MongoDB.
-
Cassandra.
Análisis estadístico
-
Programación científica en Python.
-
NumPy, SciPy, Matplotlib.
-
Pandas, Seaborn.
-
Scikit-learn, TensorFlow.
-
Estadística computacional con R.
-
RStudio.
-
Paquetes CRAN.
-
Sparklyr.
Visualización de datos
-
Visualización.
-
Tableau.
-
D3, Plotly, Highcharts.
-
Redes y grafos (Gephi).
-
Visualización en Python (Bokeh).
-
Visualización en R (ggplot2, Shiny, Leaflet).