No todos los gráficos son iguales
En el análisis de datos, un gráfico no es solo una imagen bonita; es una herramienta de comunicación. Sin embargo, no todas las herramientas sirven para el mismo propósito. El error más común es usar la misma mentalidad y las mismas técnicas para dos tareas fundamentalmente diferentes: **explorar los datos** para encontrar insights y **explicar los datos** para comunicar esos insights.
Entender esta diferencia es el primer y más importante paso para contar historias efectivas con datos. Una visualización debe tener un propósito claro, y ese propósito dicta cada decisión de diseño que tomamos, desde el tipo de gráfico hasta el uso del color y el texto. Confundir estas dos fases lleva a dashboards confusos para los directivos o a análisis superficiales para los técnicos.
Exploración vs. Explicación
Visualización Exploratoria
El Objetivo: Encontrar la historia. Esta es la fase de "hablar con los datos". Creamos docenas de gráficos para nosotros mismos o para un equipo técnico. Buscamos patrones, anomalías, correlaciones y cualquier cosa que parezca interesante.
- Audiencia: Tú mismo, tu equipo técnico.
- Prioridad: Rapidez y flexibilidad.
- Características: Puede ser denso, complejo o "feo". Lo importante es que te permita ver todas las facetas de los datos sin limitaciones.
- Ejemplo en Shiny: Un dashboard con múltiples filtros que permiten al usuario cruzar variables libremente para hacer sus propios descubrimientos.
Visualización Explicativa (Storytelling)
El Objetivo: Contar la historia. Ya encontraste el insight en la fase exploratoria. Ahora, tu trabajo es comunicarlo de la forma más clara y convincente posible a una audiencia que no tiene tiempo para explorar.
- Audiencia: Jefes, clientes, el público general.
- Prioridad: Claridad y simplicidad.
- Características: Limpio, enfocado y con un mensaje claro. Se eliminan las distracciones y se guía la atención del espectador con color, tamaño y anotaciones.
- Ejemplo en Shiny: Un gráfico específico que resalta con un color diferente a los colegios con puntajes globales superiores a 350, con un título que dice: "El 15% de los colegios de la muestra alcanzan un rendimiento alto".
Cuándo Usar Qué Gráfico (Y Por Qué)
Elegir el tipo de gráfico correcto es fundamental. La elección depende de la pregunta que quieras responder.
Para visualizar una Distribución
Pregunta: ¿Cómo se distribuyen los valores de una sola variable?
Gráficos: Histograma, Gráfico de Densidad, Boxplot, Violín.
Para visualizar una Relación
Pregunta: ¿Cómo se relacionan dos o más variables entre sí?
Gráficos: Gráfico de Dispersión, Gráfico de Burbujas, Heatmap.
Para visualizar una Comparación
Pregunta: ¿Cómo se comparan los valores entre diferentes categorías?
Gráficos: Gráfico de Barras, Lollipop, Gráfico de Líneas.
Para visualizar una Composición
Pregunta: ¿Cómo se compone un todo a partir de sus partes?
Gráficos: Gráfico de Barras Apiladas, Treemap, Gráfico Circular (¡con precaución!).
En nuestra galería interactiva (`app.R`) podrás ver ejemplos de todos estos tipos aplicados a los datos del ICFES.
Repaso: La Gramática de `ggplot2`
La base de cualquier gran visualización en R es `ggplot2`. Su "gramática" nos permite construir gráficos capa por capa. Recordar esta estructura es clave antes de añadir interactividad.
# 1. Iniciar el gráfico con los datos y las estéticas base
ggplot(data = datos_saber, aes(x = punt_matematicas, y = punt_lectura_critica)) +
# 2. Añadir una capa de geometría (los objetos visuales)
geom_point(aes(color = rendimiento_global), alpha = 0.6) +
# 3. Añadir etiquetas y títulos
labs(
title = "Relación entre Puntajes de Matemáticas y Lectura",
subtitle = "Coloreado por rendimiento global del estudiante",
x = "Puntaje en Matemáticas",
y = "Puntaje en Lectura Crítica",
color = "Rendimiento"
) +
# 4. Personalizar el tema y la apariencia
theme_minimal()
- Datos (Data): El dataframe que contiene la información.
- Estéticas (Aesthetics): El mapeo de las variables a propiedades visuales (`x`, `y`, `color`, `fill`, `size`, `alpha`).
- Geometrías (Geoms): Los objetos visuales que representan los datos (`geom_point()`, `geom_bar()`, `geom_line()`).
- Escalas, Etiquetas y Temas: Capas adicionales para refinar las escalas de los ejes, los títulos (`labs()`) y el aspecto general del gráfico (`theme_*()`).
Dominar esta estructura nos da el poder de construir prácticamente cualquier tipo de visualización estática que podamos imaginar, sentando una base sólida antes de añadir la capa de interactividad.