Módulo 1: Procesamiento Batch con Hadoop
- Hadoop: Fundamentos y Arquitectura
- Pig: Análisis de Datos Simplificado
- Hive: Consultas SQL en Hadoop
- Sqoop: Transferencia de Datos Eficiente
- Flume: Ingesta de Datos en Tiempo Real
- Spark Core: Procesamiento Rápido en Memoria
Módulo 2: Streaming Processing
- Fundamentos del Streaming Processing
- Spark Streaming: Análisis en Tiempo Real con Spark
- Kafka: Plataforma de Streaming Robusta
- Pulsar y Apache Apex: Alternativas Avanzadas
Módulo 3: Sistemas NoSQL
- HBase: Almacenamiento Escalable
- Cassandra: Alta Disponibilidad y Rendimiento
- MongoDB: Flexibilidad y Escalabilidad
- Neo4J: Base de Datos de Grafos
- Redis: Caché y Almacenamiento en Memoria
Módulo 4: Computación Híbrida y Cloud
- Arquitecturas Lambda y Kappa
- Apache Flink: Procesamiento Unificado
- Druid y ElasticSearch: Análisis en Tiempo Real
- Cloud Computing: AWS y Google Cloud
Módulo 5: Administración y Visualización
- Administración de Clústeres con Cloudera
- Optimización y Monitorización
- Visualización con Tableau y CartoDB