La representación gráfica de los datos para facilitar su comprensión.

Es frecuente encontrarlo abreviado como dataviz por su nombre en inglés de Estados Unidos (data visualization).

Descripción

Una visualización de datos consta de una estructura, anotaciones (ampliaciones de información) y codificaciones (elementos gráficos).

La visualización de datos ayuda a:

  • detectar patrones, tendencias o anomalías

  • comunicar hallazgos de manera clara a diferentes audiencias

  • apoyar la toma de decisiones, ilustrando el impacto de los datos

Gráficos y diagramas

Aunque ambos son herramientas de visualización de datos, la diferencia principal entre un gráfico y un diagrama radica en qué representan: los gráficos se centran en los números, mientras que los diagramas se centran en las relaciones y los procesos.

Gráficos

Un gráfico es una representación visual de datos, generalmente numéricos, que utiliza elementos geométricos (como puntos, líneas, barras o sectores) para mostrar la relación estadística o matemática que existe entre ellos. Su función principal es transformar cifras abstractas en patrones visuales, permitiendo identificar tendencias, valores máximos, mínimos y proporciones de manera mucho más intuitiva que leyendo una tabla de datos tradicional.

A diferencia de una infografía, que es narrativa y explicativa, el gráfico es una herramienta sintética y técnica. Se rige por un sistema de coordenadas o escalas precisas en la que cada elemento visual tiene una correspondencia directa con una magnitud física o cuantitativa. Es el lenguaje universal para comparar variables y analizar el comportamiento de un fenómeno a lo largo del tiempo o dentro de un conjunto.

Diagramas

Un diagrama es una representación gráfica que utiliza formas geométricas, flechas y símbolos para ilustrar las relaciones, estructuras o pasos de un proceso, priorizando la lógica y la jerarquía sobre los datos numéricos. A diferencia de un gráfico estadístico, su objetivo no es medir magnitudes, sino simplificar la comprensión de un sistema complejo o un flujo de trabajo, permitiendo visualizar cómo interactúan las distintas partes de un todo.

No necesita datos numéricos; su propósito es explicar cómo funciona algo, cómo se organiza una jerarquía o cuál es el flujo de un proceso. Se basa en la lógica y la conexión entre ideas.

Infografía

La infografía es una de las ramas más populares y accesibles de la visualización de datos e información. Se trata de una representación visual diseñada para comunicar información compleja, datos o conceptos de manera rápida y clara.

Mientras que la visualización de datos pura suele enfocarse en representar números de forma automática (como un gráfico de barras o un mapa de calor), la infografía añade una capa de narrativa y diseño editorial. Combina elementos gráficos (como iconos, ilustraciones y diagramas) con textos breves y precisos, aprovechando que el cerebro humano procesa las imágenes mucho más rápido que las palabras. Su objetivo principal es sintetizar el contenido para que los lectores puedan entender la idea general de un vistazo.

En una entrevista para el blog PuntoEdu, el premiado infografista Jaime Serra3 definía de la siguiente manera la infografía:

La infografía es una herramienta de comunicación de alta precisión que utiliza dos lenguajes: la imagen y la palabra. Ambos se encuentran combinados de tal manera que uno no se entiende sin el otro. Ahí donde no llega uno, llega el otro. Juntos consiguen un nivel de precisión mucho más alto que cualquiera de los dos por separado.

Para que sea efectiva, una infografía debe mantener un equilibrio entre estética y funcionalidad. Suele organizar la información de forma jerárquica o secuencial, guiando el ojo del espectador a través de una «historia» visual que facilita la retención de datos. Se utiliza ampliamente en el periodismo, la educación y el marketing debido a su capacidad para hacer que temas áridos resulten atractivos y fáciles de digerir.

Ejemplos

Gráficos y diagramas

Un gráfico utilizado para analizar y representar visualmente el proceso de intercambio de dos bienes entre dos individuos. Se fundamenta en la teoría microeconómica del equilibrio general y se emplea para explicar la eficiencia en el intercambio de bienes, representando las curvas de indiferencia de cada una de las partes que intervienen en el intercambio.

La caja de Edgeworth fue introducida por Francis Ysidro Edgeworth y complementada más tarde por Arthur Lyon Bowley.

Tipo de gráfico o diagrama en forma de árbol, útil para la visualización de datos clasificados en categorías, como la estructura de agrupación en un análisis clúster jerárquico.

El dendrograma permite ilustrar dos tipos de relaciones entre unidades de datos: la agrupación o clustering por categorías y la jerarquía entre categorías.

Las partes o elementos de un dendrograma son:

  • hojas (cada hoja representa una observación individual)
  • ramas (muestran cómo se agrupan las observaciones)
  • nodos (puntos de unión entre clústeres)
  • altura (refleja la distancia entre los grupos)

Un diagrama de flujo es una representación gráfica de un algoritmo o proceso que utiliza una serie de símbolos estandarizados para mostrar los pasos secuenciales de una tarea. Su propósito es desglosar un procedimiento complejo en acciones individuales y puntos de decisión, permitiendo visualizar de principio a fin cómo se llega a un resultado.

Cada figura en el diagrama tiene un significado específico: los óvalos indican el inicio o el fin, los rectángulos representan una acción o proceso y los rombos señalan una decisión que divide el camino (generalmente con una respuesta de «Sí» o «No»). Gracias a esta estructura, es una herramienta indispensable para programadores, ingenieros y gestores que buscan optimizar flujos de trabajo o detectar errores en un sistema.

En estadística, una representación gráfica que organiza y muestra un conjunto de datos numéricos de manera ordenada. Permite visualizar la distribución de los datos de manera compacta, manteniendo la información exacta de los datos originales.

En inglés, stem and leaf plot.

Características

  • División en dos partes: El “tallo” representa la parte principal del número (generalmente los dígitos más significativos), mientras que la “hoja” representa la parte final del número (generalmente el dígito menos significativo). Por ejemplo, si tenemos el número 42, el tallo sería 4 y la hoja sería 2.
  • Visualización de la distribución: Permite observar la distribución de los datos y las frecuencias de cada valor dentro de un conjunto de datos, de una manera ordenada y visualmente clara.
  • Conserva los datos originales: A diferencia de otros tipos de gráficos (como el
    histograma

    Una técnica de visualización de datos que utiliza barras de superficie proporcional a la frecuencia de los valores numéricos representados y(…)

    » data-link=»https://www.carolinacampalans.com/glosario/histograma/» data-mobile-support=»0″ data-gt-translate-attributes=»[{«>histograma

    , que agrupa los datos en intervalos), conserva la información exacta de los valores, lo que permite una visualización detallada sin perder precisión.

  • Organización ordenada: Los valores en el diagrama se organizan generalmente de menor a mayor, lo que facilita la identificación de patrones o tendencias en los datos.

Un diagrama o gráfico de líneas en que se rellena con color o textura el área bajo la línea. Los gráficos de área se utilizan para ilustrar la evolución de ciertos valores cuantitativos a lo largo de intervalos de tiempo y son de utilidad especialmente en aquellos casos en que interesa enseñar tendencias mas que la variación de los datos específicos.

Imagen: ejemplos de gráficos

Ejemplos de gráficos de líneas y de área. Fuente: Infogram. En línea: https://infogram.com/es/crear/grafico-linea Consulta: 09/09/2020.

Una técnica de visualización de datos en que diversos conjuntos de datos categóricos se representan mediante barras rectangulares de longitud proporcional a los valores representados.

Si las columnas están dispuestas de manera vertical, recibe el nombre de gráfico de columnas.

Este tipo de gráfico fue introducido en estadística en 1786 por William Playfair.

Un gráfico de barras dispuestas en forma vertical.

Un gráfico de dónut es un gráfico de tarta en el que la parte central aparece vaciada.

Gráfico en que se conectan mediante líneas varios marcadores de puntos de datos. El gráfico de líneas se utiliza para ilustrar la evolución de valores cuantitativos a lo largo de intervalos de tiempo. Cuando en un gráfico de líneas se ha rellenado mediante color o textura la zona bajo la línea, suele recibir el nombre de gráfico de área.

Figura: ejemplos de gráficos

Ejemplos de gráficos de líneas y de área. Fuente: Infogram. En línea: https://infogram.com/es/crear/grafico-linea Consulta: 09/09/2020.

Una técnica de visualización de datos, que se utiliza en estadística para representar la distribución de datos cualitativos en términos de porcentajes o proporciones sobre un total. Su creación se atribuye a William Playfair en 1801.

Es conocido también como gráfico circular, gráfico de pastel o gráfico de quesitos.

Modalidad de visualización de datos en que los diversos valores se representan mediante colores. Una de las aplicaciones más habituales de este tipo de gráfico es en el análisis del tráfico y UX de sitios web.

Una técnica de visualización de datos que utiliza barras de superficie proporcional a la frecuencia de los valores numéricos representados y agrupados en intervalos de valores.

Un histograma es una representación gráfica de la distribución de frecuencias de un conjunto de datos continuos o agrupados en intervalos. Es una herramienta fundamental en la estadística descriptiva para visualizar cómo se distribuyen los valores de una variable.

El histograma permite:

  • Visualizar la forma de la distribución de los datos (simétrica, asimétrica, unimodal, bimodal, etc.).
  • Identificar la tendencia central (dónde se acumulan la mayoría de los datos).
  • Detectar la dispersión o variabilidad de los datos.
  • Localizar valores atípicos o outliers que se encuentren lejos del cuerpo principal de la distribución.

Componentes y funcionamiento

Un histograma se compone de la siguiente manera:

  • Eje horizontal (eje x): Representa la variable de interés (por ejemplo, altura, peso, tiempo) dividida en intervalos o clases consecutivos. Estos intervalos no deben superponerse.
  • Eje vertical (eje y): Representa la frecuencia (absoluta, relativa o porcentual) con la que los datos caen dentro de cada intervalo.
  • Barras: El histograma utiliza barras rectangulares adyacentes (sin espacio entre ellas, a diferencia de un gráfico de barras simple) donde:
    • La base de cada barra coincide con la amplitud del intervalo en el eje x.
    • La altura de cada barra es proporcional a la frecuencia del intervalo. En algunos casos, especialmente cuando las amplitudes de los intervalos son desiguales, la altura representa la densidad de frecuencia (frecuencia dividida por la amplitud del intervalo), de modo que el área de la barra es lo que realmente representa la frecuencia.

Comparación histograma/gráfico de barras

La representación gráfica de un histograma es parecida a la de un gráfico de barras, pero se diferencia en el tipo de datos estadísticos y en la organización por intervalos.

  • Tipo de datos: El histograma se usa para datos continuos o para datos agrupados en intervalos y el gráfico de barras, para datos categóricos o discretos.
  • Representación gráfica: En el histograma las barras están pegadas para simbolizar la continuidad de la variable, mientras que en el gráfico de barras están separadas porque las categorías son distintas e independientes.
  • Función: El histograma muestra la distribución de la variable y el gráfico de barras muestra la comparación entre categorías.

Tipos de histogramas

  • Histograma de frecuencias absolutas
  • Histograma de frecuencias relativas
  • Función densidad
  • Curva acumulativa u ojiva
  • Curva acumulativa de frecuencias absolutas

Ejemplos

Distribución de frecuencias de la altura de 50 estudiantes

Vamos a visualizar la distribución de altura de los 50 estudiantes de un curso. Las dimensiones, en este caso, son valores continuos, puesto que corresponden a intervalos de 5 centímetros cada uno.

La distribución absoluta es la siguiente:

  • A [150-155): 4 estudiantes.
  • B [155-160): 8 estudiantes.
  • C [160-165): 15 estudiantes.
  • D [165-170): 13 estudiantes.
  • E [170-175): 7 estudiantes.
  • F [175-180): 3 estudiantes.
    Total: 50 estudiantes.
Intervalo de altura (cm) Frecuencia absoluta
A [150-155) 4
B [155-160) 8
C [160-165) 15
D [165-170) 13
E [170-175) 7
F [175-180) 3

Esta tabla es ideal para construir un histograma por los siguientes motivos:

  • Variable continua: La altura es una variable continua, lo que quiere decir que puede tomar cualquier valor dentro de un rango (ej. 162.3 cm, 162.45 cm).
  • Intervalos (clases): El eje horizontal del histograma se define por estos intervalos (ej., de 150 a 155 cm).
  • La notación [150−155) significa que incluye 150 cm pero excluye 155 cm.
  • Los intervalos son consecutivos y no se superponen, lo que permite que las barras del histograma estén juntas.
  • Frecuencia absoluta (f i): Este es el valor que define la altura de cada barra del histograma. Indica cuántos estudiantes caen dentro de cada rango de altura.
  • Histograma: Al dibujar el histograma, los intervalos de altura irán en el eje x y la frecuencia absoluta (f i), en el eje y.

Técnica de visualización de datos utilizada en análisis de contenidos, en que se emplean recursos gráficos (como el tamaño o tipo de fuente o el color) para representar la frecuencia con que cada palabra aparece en el texto.

Nube de palabras a partir de la entrada en el glosario «Visualización de datos», elaborada con NubedePalabras.es.

Cuando la nube de palabras se elabora a partir de las etiquetas o tags asignadas a las diferentes unidades de contenido de un sitio web, hablamos de nube de etiquetas.

Casos

Infografía publicada en South China Morning Post. Autores: Adolfo Arranz y Pablo Robles.

Visualización de datos sobre las personas fallecidas en la guerra de la Franja de Gaza desde octubre de 2023, publicada en diario El País de España.

Especial interactivo del suplemento Verne de El País (España) que aborda los tabús culturales que envuelven la regla femenina y propone ideas para acabar con ellos. Proyecto finalista de los premios de la Fundación Gabo 2020 de periodismo, en la categoría innovación.

A raíz de la ola de calor que azota Europa en el verano de 2022, el diario El País de España publica una infografía que explica cómo se produce un golpe de calor y qué efectos tiene sobre el organismo humano.

La visualización de datos es un recurso fundamental para la toma de decisiones fundamentadas o para el análisis del entorno. Durante la pandemia por Covid-19 facilitó el monitoreo de la enfermedad, así como la adopción de medidas de control y prevención.

El proyecto COVID-19 GIS Hub utilizó los datos recopilados por la propia comunidad:

Understand, prepare for, and respond to pandemics in your community or organization.

Bibliografía recomendada

Lupi, Giorgia y Posavec, Stefanie (2018). Dear Data. Flow Press Media.

  • Una aproximación diferente a la visualización de datos, mediante técnicas analógicas de dibujo y muy afín al pensamiento visual.

Recursos en línea

Social media

  1. Gonzales, Sharún (2016, 5 de agosto). "Una infografía periodística bien hecha es periodismo, no tiene nada de arte", puntoedu.pucp.edu.pe. Acceso 12/04/2020.
  2. Gonzales, Sharún (2016, 5 de agosto). "Una infografía periodística bien hecha es periodismo, no tiene nada de arte", puntoedu.pucp.edu.pe. Acceso 12/04/2020.
  3. Gonzales, Sharún (2016, 5 de agosto). «Una infografía periodística bien hecha es periodismo, no tiene nada de arte», puntoedu.pucp.edu.pe. Acceso 12/04/2020.
Sinónimos:
data visualization, data visualisation
Categorías: Métodos