0 Comments

¿Cuáles son las herramientas imprescindibles del periodismo de datos?

Los datos están tomando un papel fundamental en la calidad de las noticias. Según el autor Mirko Lorenz, “los datos son la base para el análisis, la visualización y, lo más importante, la narración”.

datajournalismEn periodismo, la pirámide invertida es la estructura más utilizada para escribir una noticia. Esta estructura sugiere escribir organizando la información de mayor a menor importancia. En caso del periodismo de datos, la línea de trabajo sigue siendo la misma.

Los 5 pasos de la pirámide invertida del periodismo de datos son estos:

1) Recopilación de datos

La persona que trabaje en la recopilación de datos, puede utilizar los recursos de más de una fuente, como por ejemplo, los portales de datos abiertos o los sitios web de las Administraciones Públicas con múltiple información estadística. Además, si lo considera necesario, puede hacer scraping (técnica utilizada mediante programas de software para extraer información de sitios web), y puede utilizar herramientas como Scraperwiki. Si la persona usuaria tiene acceso a una base de datos, una manera interesante para almacenar, manipular y recuperar estos datos es mediante el lenguaje SQL. Una de sus características es el manejo del álgebra y el cálculo relacional que permiten efectuar consultas con el fin de recuperar, de forma sencilla, información de bases de datos, así como hacer cambios.

2) Limpieza y análisis

Una vez obtenido los datos, el siguiente paso a seguir es la limpieza, manipulación y el análisis de estos. Es muy importante que la persona usuaria tenga conocimientos a nivel avanzado de hojas de cálculo como MS Excel, OpenOffice Calc o Google Sheets. Otra de las herramientas más conocidas para depurar datos es OpenRefine. Más específicamente, el paquete Numpy sirve para la computación científica con Python. Para el lenguaje R por ejemplo se pueden utilizar dplyr y tidyr.

3) Contextualización

Los datos no vienen aislados y es por eso que la persona que los manipule debe de entender los códigos que representan, las categorías, clasificaciones y ubicaciones.  Es decir, los datos tendrán un objetivo cuando estén contextualizados en un tema.

4) Combinación

La combinación de datos es otro punto importante en la estructura de la pirámide invertida. Gracias a la herramienta Google Fusion Tables, se combinarán unos datos con otros.

5) Comunicación

En esta última etapa, el objetivo es el de visualizar los datos. Para ello, hay herramientas de pago como Tableau, Qlikview, TileMill o Infogr.am para hacer gráficos e infografías de distintos tipos. Otras herramientas conocidas son d3.js y GoogleCharts. Además, otras herramientas gráficas, también de pago, como Illustrator, Indesign o Photoshop hacen la labor de presentar los datos mediante imágenes o gráficos.

 

Lenguajes de programación

Los lenguajes de programación, que sirven para realizar procesos para que puedan ser llevados a cabo por máquinas, tienen mucha importancia en el periodismo de datos. Existen muchas herramientas o lenguajes para el análisis estadístico, pero las más demandadas se pueden concretar en tres: R, SAS y Python.

Cada una está definida de una manera distinta, pero para los principiantes, la más adaptada se considera Python. Las otras dos en cambio tienen una estructura más compleja. En cuanto al coste, SAS es un software comercial, mientras que R y Python son gratuitos.

En resumen, SAS ofrece soluciones integradoras. R tiene muchas capacidades de innovación y Python tiene la ventaja de ser un lenguaje de programación generalista.

Categories:

Deja una Respuesta