El alumno aprenderá a descubrir y valorar oportunidades presentes en el día a día del ciudadano y de la empresa.
Internet de las cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brókers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales. Aproximación a la aportación del IOT al mundo del macrodato.
Conectividad con fuentes de datos heterogéneas a través de bróker de mensajes y hubs con dispositivos
- ETL as a Service.
- Gobierno de los datos as a Service.
- Stream Analytics, CEP análisis en memoria en tiempo real en los eventos complejos as a Service.
Índice de contenidos
Hadoop:
- Introducción a Hadoop, entorno de trabajo que soporta diversas aplicaciones distribuidas bajo una licencia libre.
- Almacenamiento HDFS para grandes volúmenes de datos en Apache Hadoop
- Acceder a los datos almacenados en HDFS como si fuera una base de datos: introducción a HIVE
Spark
- Introducción a Spark, sistema de computación basado en el paradigma de Hadoop que destaca por su velocidad gracias al almacenamiento de datos en memoria
- Clúster de Spark
- Desarrollo de aplicaciones con Spark
- RDD, Datasets y transformaciones
- Spark Streaming
Tecnologías Big Data en Google Cloud
- Ingesta y procesamiento en batch: Cloud Dataproc
- Ingesta en streaming: Cloud PubSub
- Almacenamiento de ficheros: Google Cloud Storage
- Almacenamiento de datos: BigQuery
- Desarrollo y ejecución de pipelines: Cloud Data Fusion
- Visualización de datos: Cloud Data Studio
- Analítica avanzada de datos: Vertex AI
- Orquestación de datos: Cloud Composer
- Catálogo y gobierno del dato: Cloud Dataplex