El curso se estructura en cuatro módulos clave para dominar el Data Mining:
Módulo 1: Fundamentos del Descubrimiento de Conocimiento
- Definición y alcance del Data Mining.
- Análisis exhaustivo de las fases del proceso CRISP-DM: Comprensión del problema, datos, preparación, modelado, evaluación e implementación.
Módulo 2: El Ciclo de Data Mining en Profundidad
- Tipos de problemas: Descriptivos (asociación, clustering) y Predictivos (clasificación).
- Implicaciones de los datos, dominios y técnicas en cada fase del proceso.
- Análisis de casos de uso reales y relevantes.
Módulo 3: Técnicas Avanzadas de Data Mining
- Clasificación: Implementación de Árboles de Decisión y Naive Bayes.
- Clustering: Aplicación de K-means y EM para segmentación.
- Asociación: Reglas A priori para descubrir relaciones ocultas.
Módulo 4: Consolidación y Aplicación Práctica
- Presentación y análisis de un caso práctico integral.
- Aplicación del proceso CRISP-DM en un entorno real.
- Elaboración de un plan de proyecto detallado y ejecutable.