0 Comments

Zeintzuk dira datu kazetaritzaren funtsezko tresnak?

Datuak berebiziko indarra hartzen ari dira albisteen kalitatean. Mirko Lorenz autorearen arabera, “datuak analisirako, bistaratzeko, eta garrantzitsuena, narraziorako oinarri dira”.

datajournalismKazetaritzan, albiste bat idazteko erabiltzen den egiturarik ohikoena alderantzikatutako piramidea da. Egitura honek informazioa garrantzi gehien duenetik gutxienera antolatzea iradokitzen du. Datu kazetaritzaren kasuan, lan ildoa berdina da.

Datu kazetaritzaren piramide alderantzikatuaren 5 pausoak hauek dira:

1) Datu bilketa

Datu bilketan lan egiten duen pertsonak, iturri bat baino gehiagotik hartu ditzake errekurtsoak: datu irekien atarietatik edo Administrazio Publikoaren web orrialdeetatik, adibidez. Gainera, beharrezkoa ikusten bada, scraping egiteko aukera dago (software programen bidez web orrialdeetatik informazioa lortzeko teknika), horretarako Scraperwiki bezalako tresnak erabiliz.

Erabiltzaileak datu base batera sartzeko aukera badu, datu horiek gordetzeko, erabiltzeko eta berreskuratzeko modu interesgarriena SQL lengoaia da. Lengoaia honen ezaugarrietako bat aljebraren maneiua eta kalkulu erlazionala da. Informazioa datu baseetatik berreskuratzeko helburuarekin, kontsultak egiteko aukera ematen dute.

2) Garbiketa eta analisia

Datuak lortu ondoren, hurrengo pausua hauen garbiketa, erabilera eta analisia egitea da. Garrantzitsua da horretarako erabiltzaileak kalkulu orrien, MS Excel, OpenOffice Calc eta Google Sheets besteak beste, ezagutza maila aurreratua izatea. Datuak garbitzeko beste tresna ezagun bat OpenRefine izenekoa da. Espezifikoki, Numpy paketeak Pythonekin konputazio zientifikoa egiteko balio du. R lengoaiarako adibidez dplyr eta tidyr erabili daitezke.

3) Testuinguruan jarri

Datuak ez datoz bakarrik, eta horregatik erabiltzaileak hauek adierazten dituzten kodigoak, kategoriak, sailkapenak eta kokapenak ulertu behar ditu. Hau da, datuek, gai baten testuinguruan jarritakoan, helburu bat izango dute.

4) Konbinaketa

Alderantzikatuko piramidearen egituran datuen konbinaketa puntu garrantzitsua da. Google Fusion Tables tresnari esker, datuak elkarren artean konbinatu ahalko dira.

5) Komunikazioa

Azken etapa honetan, helburua datuak bistaratzea da. Horretarako, Tableau, Qlikview, TileMill eta Infogr.am bezalako ordainpeko tresnei esker, mota ezberdinetako grafikoak eta infografiak egin daitezke. Beste erreminta ezagun batzuk d3.js eta GoogleCharts  dira. Horretaz gain, eta ordainpekoak ere, Illustrator, Indesign eta Photoshop programek datuak irudien eta grafikoen bitartez aurkezten dituzte.

 

Programaziorako lengoaia

Programaziorako lengoaiek, makinek egin ahal dituzten prozesuak burutzeko balio dituztenak, garrantzi handia dute datu kazetaritzan. Analisi estatistikorako tresna edo lengoaia asko daude, baina erabilienak hiru dira: R, SAS eta Python.

Bakoitza modu batean definituta dago, baina hasiberrientzat, egokiena Python kontsideratzen da. Beste biek ordea, egitura konplexuagoa dute. Kostuari dagokionez, SAS software komertziala da, R eta Python dohainekoak diren bitartean.

Laburbilduz, SAS-ek konponbide integratzaileak ematen ditu. R-k berrikuntzarako gaitasun handiak ditu, eta Python orotariko programazioa duen lengoaia da.

Categories:
Sin categoría

Deja una Respuesta