Lectura: Cómo contar historias con datos

Realiza la lectura sobre limpieza y estructuración de bases de datos.

Si tienes dudas o comentarios, no dudes en agregarlos en la sección de comentarios.

Cómo crear historias con datos 

Los datos pueden ser en la mayoría de casos un asunto difícil de comprender, podríamos pensarlos como registros de información, tales como la edad de una persona o su color favorito. Pero en general no significan nada si no se brinda un contexto o no se cuenta una historia con ellos. 

A veces encontramos que existen bases de datos que se realizan y disponibilizan, pero que nadie las usa o no se indaga más allá de la misma. Por eso hemos decidido contar historias con ellas a través del cruce de los datos con la tecnología. Por lo general la creación de historias o comunicaciones con datos incluye un trabajo colaborativo constante entre distintas personas con distintos enfoques disciplinarios, que pueden incluir periodistas, ciudadanas (os), diseñadoras (es) y desarrolladoras (es), que desde su propia experticia juegan papeles muy importantes para contar solamente una historia.

Hemos visto históricamente cómo se cuentan historias con datos desde un punto de vista académico, muy enfocado en usuarias (os) con experticia en los temas, pero sin poder ser comprendidas por públicos mucho más generales que quieran acercarse a información visualmente atractiva. En este sentido las historias con datos que queremos abordar en este curso tienen un componente de arte, de información cautivadora y que invita a cualquier persona a conocer el proyecto.

Esta clase se acerca a la disciplina del periodismo de datos, que se podría definir como aquellas acciones de recopilación y análisis de datos que buscan comunicar información de la manera más comprensible para la ciudadanía, a través fundamentalmente de visualizaciones de datos. 

Esta forma de contar historias con datos busca tener un impacto en la ciudadanía. Por ejemplo, el diario británico The Guardian en 1821 publicó en su periódico una tabla que contaba el número de los niños y niñas que iban a la escuela en Manchester y el costo que suponían estos alumnos comparados con los índices de pobreza infantil y escolarización. Lo que implicó un gran impacto en la ciudadanía y permitió abrir el debate sobre el acceso a la educación en el país.

Sin embargo, el flujo de información del periodismo a veces lo podemos conocer únicamente cuando una nota periodística o un informe es publicado. Lo que quiere decir que existen muchos contenidos con datos autocontenidos, por ejemplo gráficas y afirmaciones a partir de datos pero no necesariamente la fuente de información -que en la mayoría de casos es una base de datos-. 

En este sentido podemos identificar que existe un flujo de información de un proyecto con datos:

  • Iniciando con la recopilación de los datos, donde se deben hacer preguntas como ¿Dónde está la información? ¿Cómo accedemos a ella? ¿En qué formatos están?
  • Seguido del análisis de los datos, donde se hacen preguntas y entrevistas a los datos, y se encuentran las mejores maneras de comunicar la información.
  • Visualización de los datos, donde se eligen las mejores maneras de graficar los datos que acompañarán la historia.
  • Para finalmente conseguir una respuesta para que las personas receptoras puedan tomar buenas decisiones. 

Este flujo no es tan lineal ni tan rápido, puesto que a veces los datos no son tan sencillos de recopilar, o a veces no se tiene completo conocimiento de las mejores visualizaciones para comunicar la información. 

Los datos pueden tener muchas barreras en el acceso a los mismos, podemos buscar datos que no existen, no se recopilan o existen parcialmente, ese es el caso de los datos de violencia contra personas LGBT, que en muchos casos no es información que se recopila y no existe una metodología de recolección. También pueden tener buenos formatos pero tener mala calidad, o buenos datos pero disponibilizados en malos formatos, como aquellos registros de enfermedades en un país, que pueden tener buenos formatos pero con información incompleta, o información sobre sentencias judiciales que son datos de buena calidad pero disponibilizados en formatos no reutilizables.

Al tener estas múltiples fuentes de información, ahora se tiene que pensar en el balance a tener en cuenta en el momento de contar una historia con datos. Tenemos un mundo cualitativo y cuantitativo, que tiene que lograr una relación entre las cifras y las historias que contienen estas cifras. Esto se evidencia en las bases de datos cuando hay personas que no están contabilizadas en los registros de bases de datos y cuando hay personas que solamente figuran en los registros. Donde las historias que hay dentro de los registros son fundamentales -como las víctimas de violencia estatal- y donde las historias también tienen una necesidad de hacer parte de los registros -como las víctimas de discriminación LGBT-. Lo que implica un componente de humanización de los datos donde el registro es parte de la historia.

A su vez, debemos contar con historias que pueden ser simples o historias más complejas, con grandes y pocas audiencias, donde el número de personas que quieren comprender a fondo una historia pueden ser mucho menos que cuando se abordan temas que todo el mundo se puede ver interesado y comprender. Esto mismo se evidencia cuando usamos los componentes gráficos de las historias, donde hay unos muy básicos u otros más complejos para audiencias más técnicas.

Ahora, la pregunta es ¿Qué historia contar con los datos? 

Debido a que existen muchas formas de extraer información a partir de fuentes de datos, es fundamental hacer una lista de asuntos que podrían ser interesantes para comunicar la información, por ejemplo las impresiones iniciales de los datos, pero también la realización de una extensa lista de preguntas iniciales con posibles cruces de variables e incluso con cruces de otras fuentes de información que puedan resultar útiles. Aquí es relevante reconocer que pueden existir patrones y tendencias en los conjuntos de datos interesantes para nuestros usuarios (as).

El análisis de la información se debe pensar como cuando se entrevista a una persona. Se debe reconocer el contexto del tema, la información disponible, la entidad u organización que la recopila, cómo se recopila, entre otros.

Por ejemplo, si tenemos una base de datos de censo de arbolado en una ciudad, podemos preguntarnos cuántos árboles hay en total y cuántos árboles hay en determinado sector, cuyas respuestas se pueden encontrar en la misma base de datos. Pero también podemos preguntarnos cuántos árboles hay por cada habitante, o si en los sectores más pobres de la ciudad hay menos árboles. Es información que se debe buscar con otras fuentes de información, buscando la cantidad de habitantes de la ciudad y la clasificación socioeconómica de cada sector de la ciudad, y nos va a indicar si hay patrones relacionados con la plantación de más árboles en ciertos sectores adinerados de la ciudad. 

Imágen de Datasketch. Árboles de Bogotá.

Con estas preguntas iniciales es mucho más fácil determinar el tipo de información que se debe buscar, filtrar y cruzar. Para realizar estas acciones también sugerimos crear un documento que contenga toda la información del proyecto, definiendo fechas y personas encargadas de cada tarea. Estas tareas pueden consistir en realizar pedidos de acceso a la información, realizar otras indagaciones de información, limpieza y organización de las bases de datos, escritura de 

los textos, realización de las visualizaciones o gráficas con datos, diseño web, desarrollo web, lanzamiento y promoción del proyecto.


Recursos recomendados



Discussion

0 comments