Claves para aventurarse con éxito en el periodismo de análisis de datos

Si entre tus propósitos para este año está el de aprender a analizar datos como evidencia para tus reportajes periodísticos, aquí te presento siete consejos para guiarte en tu objetivo. Éste método es el que enseño durante los cursos que imparto en la Universidad de Guadalajara en México y en otras organizaciones que impulsan la capacitación de periodistas en Latinoamérica.

Pasos:

1- Observa y pregunta: Toda buena investigación surge a partir de observar a profundidad los hechos que ocurren a tu alrededor y de hacerte preguntas que, sobre ellos, no responden las noticias diarias. Presta atención, principalmente, a aquellos temas de alto interés público donde quedan vacíos, temas sueltos por los que se cuela la duda de cómo pueden o están impactando ciertas decisiones la vida de grupos vulnerables o discriminados en la sociedad.

2- Plantea una hipótesis de trabajo: Recuerda que una hipótesis es una suposición de algo que podría ocurrir y tendría una consecuencia. Es, durante la investigación periodística que se confirma o niega la validez de la suposición planteada. A la hora de redactar tu hipótesis es muy importante evitar la vaguedad y delimitar muy bien el tema. Una forma de redactar una buena hipótesis es siguiendo esta fórmula:

Sujeto + verbo+ consecuencia

3- Luego, ¡piensa en los datos! Indaga, ¿qué bases de datos pueden ayudarte a probar tu hipótesis?, ¿qué características tienen esos datos? ¿Dónde están: En instituciones públicas, organizaciones de la sociedad civil, ONG o Universidades? ¿Se pueden descargar en línea o debes hacer un pedido de acceso a información pública?

4- Limpia y ordena antes de empezar. Cuando tengas las manos en los datos, ¡no te vayas de cabeza a las buenas y primeras a analizarlos! Antes debes depurarlos, limpiarlos.¿Qué quiero decir con eso? En el mundo de la Ciencia de los Datos hay un popular dicho que reza:“Si metes basura, basura obtendrás”. Esa frase significa que si trabajas con datos de muy baja calidad tus resultados serán pobres e imprecisos.

Por esa razón nunca debes empezar un análisis de datos sin antes haber aplicado controles de calidad sobre ellos. A esos controles de calidad suele llamárseles: Limpieza y validación de datos. Y no es más que hacer un detallado proceso de inspección de tu base de datos para detectar inconsistencias, depurar la información y asegurarte de que los datos con los que vas a trabajar son precisos. Es decir: que en ellos no hay errores que te conduzcan a conclusiones equivocadas.

La limpieza de datos es un proceso integral para detectar en un archivo de datos errores ortográficos y de tipografía. También para encontrar espacios vacíos, valores extremos corregir formatos de fechas y números, por ejemplo. Y además, para determinar dónde hay valores duplicados que podrían distorsionar el análisis, entre otros factores.

5- Ve más allá de la aritmética básica: Aplicar sumas y restas sobre los números de tu base para decir quién tiene más, quién tiene menos, no es suficiente para producir un reportaje de impacto. Ese es un error muy común del periodismo al usar números. De seguro has leído o escuchado algo como este ejemplo hipotético que te presento a continuación:

Periodista: “Un informe presentado hoy por el Departamento de Justicia revela cuáles son las ciudades más azotadas por el crimen en el país. En primer lugar, la más golpeada es Ciudad Z donde el año pasado hubo 5.000 crímenes, en segundo lugar destaca San Benito. Allí la Policía atendió 3.500 delitos. En cambio, la ciudad menos peligrosa es SantaPaz, allí solo se registraron 200 crímenes.

¿Dónde está el error? ¡En presentar los datos absolutos, sin contrastarlos con la cantidad de población que hay en cada ciudad! Por eso es obvio que siempre será la Ciudad Z la que más crímenes registrará, porque allí viven un millón de personas. Eso es impreciso y te explicó por qué. Para comparar adecuadamente la incidencia del crimen, de las enfermedades o de cualquier otro fenómeno entre ciudades, departamentos o países es necesario calcular tasas.

¿Cómo se calcula una tasa? Usando el mismo ejemplo del crimen citado arriba, para comparar adecuadamente la incidencia del crimen y determinar qué ciudad, realmente, es la más afectada por el flagelo, necesitas los siguientes datos:

  • Cantidad de casos absolutos de delitos
  • Cantidad de personas que viven en cada ciudad

Con esa información ya puedes calcular la tasa de incidencia del crimen por cada 10 mil habitantes, por ejemplo. Las estimación la haces así en una hoja de cálculo:

=10000*C2/B2

6- Verifica, verifica y verifica: Cuando hagas un análisis de datos no te emociones mucho con tus primeros resultados. Podrían ser engañosos. Como buena norma haz tu análisis varias veces, revisa bien todos tus cálculos y los pasos que seguiste para llegar a esos resultados.  En una ocasión, una alumna estaba muy emocionada porque su análisis validaba su hipótesis: ¡La exportación de trigo había caído en su país! Y ella lo atribuía a una serie de políticas e impuestos que desincentivan su cultivo. Pero, sorpresa: Cuando revisó sus cálculos se percató de que estos incluían de forma agregada otros cereales además del trigo: Cebada, avena y arroz.  Cuando hizo el análisis para cada uno de esos cereales, todos -menos el trigo- habían decaído. Por tanto, su hipótesis no era válida.

7- Sal a la calle: Este es el último consejo y es fundamental. Así como aplicas la rigurosidad y la precisión para analizar los datos, debes ser igual de riguroso y preciso para salir a la calle y ver cómo esos datos se comportan en el mundo real. Los datos son una especie de mapa del tesoro, nos guían al lugar donde podemos encontrarlo, pero para desenterrar ese tesoro hay que pasar horas reporteando, conversando con personas de carne y hueso, para entender lo que realmente nos dicen esos datos en la vida real.

Si has llegado a leer hasta aquí, quizá te interese profundizar más en el tema. Por esa razón,te dejo unos vínculos que podrían serte de utilidad:

¿Quiere convertirse en periodista de datos? Invierta tiempo y salga de su zona de comodidad

Las seis columnas del periodismo de datos

¿Cómo blindar reportajes apoyados en bases de datos?

Reflexiones sobre el periodismo de análisis de datos en el contexto de la pandemia por COVID-19

 

(Los artículos de La Data Cuenta son propiedad de su autora, Hassel Fallas. Si desea reproducirlos o hacer referencia a ellos, por favor cite la fuente original y vincule el link a su publicación).

error: No se puede descargar