Tecnologías del Big Data

El alumno aprenderá a descubrir y valorar oportunidades presentes en el día a día del ciudadano y de la empresa.

Internet de las cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brókers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales. Aproximación a la aportación del IOT al mundo del macrodato.

Conectividad con fuentes de datos heterogéneas a través de bróker de mensajes y hubs con dispositivos

  • ETL as a Service.
  • Gobierno de los datos as a Service.
  • Stream Analytics, CEP análisis en memoria en tiempo real en los eventos complejos as a Service.

Índice de contenidos

Hadoop:

  • Introducción a Hadoop, entorno de trabajo que soporta diversas aplicaciones distribuidas bajo una licencia libre.
  • Almacenamiento HDFS para grandes volúmenes de datos en Apache Hadoop
  • Acceder a los datos almacenados en HDFS como si fuera una base de datos: introducción a HIVE

Spark

  • Introducción a Spark, sistema de computación basado en el paradigma de Hadoop que destaca por su velocidad gracias al almacenamiento de datos en memoria
  • Clúster de Spark
  • Desarrollo de aplicaciones con Spark
  • RDD, Datasets y transformaciones
  • Spark Streaming

Tecnologías Big Data en Google Cloud

  • Ingesta y procesamiento en batch: Cloud Dataproc
  • Ingesta en streaming: Cloud PubSub
  • Almacenamiento de ficheros: Google Cloud Storage
  • Almacenamiento de datos: BigQuery
  • Desarrollo y ejecución de pipelines: Cloud Data Fusion
  • Visualización de datos: Cloud Data Studio
  • Analítica avanzada de datos: Vertex AI
  • Orquestación de datos: Cloud Composer
  • Catálogo y gobierno del dato: Cloud Dataplex