Simulación de un Producto de Datos Completo

El Desafío: Un Dashboard de Monitoreo

Nuestro proyecto final será construir un "Dashboard de Monitoreo de Resultados de Pruebas". Este dashboard deberá:

  • Conectarse a una fuente de datos (simulada).
  • Mostrar estadísticas descriptivas interactivas.
  • Integrar un modelo pre-entrenado para predecir el rendimiento de un estudiante.
  • Generar un reporte en PDF con los resultados de un grupo seleccionado.
  • Tener una apariencia profesional con el branding del ICFES.
  • Estar versionado con Git siguiendo un flujo de trabajo colaborativo.

El Ciclo MLOps en Acción

Seguiremos el ciclo de vida completo, aplicando los conocimientos de cada módulo:

  • Fase 1: Planificación y Prototipado (Módulos 1-3)

    Definiremos los requerimientos, configuraremos el repositorio en GitHub y crearemos un prototipo inicial con layouts básicos y visualizaciones interactivas usando `ggplot2` y `plotly`.

  • Fase 2: Desarrollo del Producto (Módulos 4-7)

    Implementaremos el pipeline de datos con `dplyr`, integraremos el modelo predictivo (`.rds`), añadiremos tablas con `DT` y la funcionalidad de descarga de reportes con `rmarkdown`.

  • Fase 3: Profesionalización (Módulo 8)

    Refactorizaremos la UI usando `shinydashboard`, aplicaremos los colores y logos del ICFES y organizaremos el código en una estructura modular para facilitar el mantenimiento.

  • Fase 4: Conectividad y Gobernanza (Módulo 9)

    Reemplazaremos los datos locales con una conexión a una base de datos simulada y gestionaremos las credenciales de forma segura usando un archivo `.Renviron`.

  • Fase 5: Colaboración y Despliegue (Módulo 10)

    Simularemos un flujo de trabajo con Pull Requests para revisar e integrar los cambios. Finalmente, prepararemos la aplicación para su despliegue, por ejemplo, usando un `Dockerfile` para Railway.

Volver al Módulo 11