≡ Menu

Analyser går i dybden

Inden for alle emner eksisterer der data og andre muligheder for analyser, der finder oversete og skjulte historier og tendenser.

Analyser tilføjer dybde og substans til journalistikken. De kan skræddersyes til mediets læsere, seere eller lyttere. Eller til organisationens medlemmer.

Eksempler:

Sådan gennemfører vi analyser

Vi ser altid på opgaven med at analysere data med journalistiske øjne. Når vi bliver spurgt til råds, kommer vi med konkrete og lettilgængelige bud på løsninger.

Vi er økonomisk ansvarlige over for kunderne. Vi holder priser, tider og andre aftaler. Man kan regne med os. Billige løsninger kan være lige så gode som dyre. Men vi fortæller også om eventuelle svagheder ved at vælge en billigere analyse, ligesom vi fraråder analyser, som vi ikke venter vil give resultater.

Kaas & Mulvad er blandt de førende i viden og erfaring inden for praktiske metoder til analyse af data.

Data ind i regneark og databaser

Med dataanalyse tænker vi normalt på analyser med brug af regneark og databaser. Den type software har gjort det muligt at foretage analyser, som tidligere tog meget længere tid. I dag kan en dataanalyse tage alt fra nogle få minutter og op til flere dage, hvis den er særlig kompliceret.

Første skridt er normalt at få data ind i programmet og beskrevet strukturen i oplysningerne. Hvad er indholdet i de forskellige felter, mangler der data? Er der andre fejl? Ofte vil man gå tilbage til leverandøren for at få forklaret disse forhold. Det kan være, at der er forkerte kontonumre, udbetalinger i forkerte perioder og lignende.

Journalistisk talanalyse

Når data er inde og velbeskrevet (det velbeskrevne kan give sig selv og være unødvendigt), begynder den egentlige journalistiske talanalyse, hvor man finder de mest relevante tendenser og cases. Det kan enten ske, fordi nogen på forhånd har givet et tip om, hvad der kan være relevant at lede efter, eller at man selv har en fornemmelse af, hvor de gode historier ligger.

Når analysen så er færdig med vinkler og cases, gælder det om at tjekke den mod virkeligheden og måske bruge input fra interview til nye tjek og undersøgelser af nye vinkler i data.

Den slags analyse er typisk både i de store projekter og de meget hurtige historier, hvor man for eksempel blot skal have modtagere af bibliotekspenge sorteret, så man kan se, hvem der får mest, og hvad de får.

Sure smileys

Data fra fødevarestyrelsen over smileys til fødevarevirksomheder er andre data, der ofte bruges til hurtige historier, for eksempel over brancher med mange sure smileys, forskel i praksis i de forskellige fødevareregioner eller de suspekte restauranter med fire sure smileys i træk.

Ejendomspriser er en anden af de gode, gamle travere inden for dataanalyse. Hvert kvartal kaster den en stribe hurtige historier af sig ligesom de årlige opgørelser af skolernes afgangskarakterer.

Samkøring med andre data

Ofte kan et datasæt umiddelbart fravristes en eller flere historier, mens data skal ses i sammenhæng med andre data for at give et større billede og nye historier.

Et eksempel er Ugebrevet A4, der en stor del af 2008 skrev om danske virksomheders import af østarbejdere. En aktindsigt i Udlændingestyrelsen gav data, der umiddelbart kunne tælles op, men det var først, da der fra andre registre blev suppleret med oplysninger om hver enkelt virksomheds branche, alder og nuværende status, at historierne for alvor blev interessante.

Senere kunne samme tema fortsætte, da data blev yderligere kombineret med fagbevægelsens oplysninger om blokader mod virksomheder. Hvorefter rundspørger til virksomheder og østarbejderne selv gav endnu flere historier til Ugebrevet.

Landbrugsstøtte og ejendomsanalyse

Eksempler på nogle af de meget store analyser er modtagere af landbrugsstøtte og nogle ejendomsanalyser. I landbrugsstøtte-analyserne er der et stort arbejde med at klargøre – systematisere – data før analysen, hvorefter man kan se, hvor de store spring i støtte er sket – eller for eksempel se al støtte i en bestemt kommune eller region. Rensearbejdet omfatter nemlig også at sætte kommunekoder og regionskoder på alle adresser ved automatisk at geokode dem.

Man kan så også se, hvad Arla får samlet under det utal af forskellige navne, adresser og virksomhedsnumre, som koncernen opererer med i de forskellige europæiske lande.

I de tunge ejendomsanalyser baserer man sig på data om samtlige ejendomme i Danmark. Dem er der samlet oplysninger om i en række forskellige tabeller med to-fire millioner poster i hver. De kan ikke bare forbindes direkte. For eksempel kan den enkelte ejendom have flere ejere med hver sin ejerandel. Og de kan have købt deres andel på forskellige tidspunkter. Her er den store udfordring meget klart at definere, hvad der skal undersøges for og først derefter trække de relevante data ud af de forskellige tabeller.

Nye tendenser

De seneste tendenser inden for dataanalyser er at benytte databaseredskaber, der gør det muligt at lave en hel stribe nye mere dybtgående analyser, som det før har været forbeholdt forskere med stor datakraft og mulighed for at udvikle programmer at gennemføre.

En anden ny tendens er tekstmining og tekstanalyse – ofte af politikeres taler.

Når vi låner fra de forskellige videnskabelige metoder til analyser inden for computerstøttet journalistik gør vi det en smule anderledes end i den traditionelle videnskabelig brug af metoderne:

Timing

I journalistisk sammenhæng er timingen afgørende. Vi må i høj grad vurdere, hvad der skal til for, at en historie slår igennem på et bestemt tidspunkt. Nogle historier passer bedst i august, for eksempel når skolerne netop er gået i gang. Andre historier er velegnede til de døde perioder i journalistisk forstand.

Historier om overvægt og fedme passer glimrende til en lancering søndag i påsken eller pinsen. Andre historier skal komme umiddelbart efter, at oplysningerne er kommet frem.

Deadline er afgørende.

Det nytter ikke noget at komme med valgresultatet to-tre dage efter, at valget er slut. Resultaterne skal på, når de kommer. Her er det nyheder i nutid. Oplysningerne skal på netmedierne, mens de sker.

I videnskab er der ikke det krav om at udføre analyser på tid op til deadline og at det tidspunkt, hvor resultaterne er færdige, er helt afgørende for, hvor mange kræfter man kan kaste efter et projekt.

Ekstremerne

I journalistik er yderpunkterne altid spændende. Vi vil se de rigeste, de dyreste, de dårligste veje, de største katastrofer, de bedste og de dårligste skoler, etc.

Hvor man i videnskab ofte smider ekstremerne væk og koncentrerer sig om midten, går vi i journalistik efter yderpunkterne, som vi gerne vælger til cases.

Ofte viser det sig også, at forklaringerne/beskrivelserne fra disse yderpunkter er de første eksponenter for nye tendenser, eller at de nye tendenser netop krystalliserer de forskellige yderpunkter. At bruge ekstremerne som cases er et kernepunkt i journalistik, en metode til at finde forklaringer.

Tjek mod virkeligheden

Journalistik handler om mennesker. Det handler selvfølgelig også om systemer og tal, men kun i det omfang disse ting påvirker livet for mennesker.

Når journalister efter en CAR-analyse har fundet en central vinkel, så skal den prøves mod virkeligheden. Der må være nogle mennesker, som oplever det, man har fundet i analysen. Og kan man ikke finde nogen mennesker, er det sikkert fordi, tallene fortæller en forkert historie, som derfor ikke skal skrives.

Det virkelighedstjek er ikke et krav i normal forskning. Her skal man ikke finde konkrete mennesker, som ens konklusioner efter analysen kan bekræfte på deres egen krop.

Har man for eksempel fundet en skoleklasse, hvor drengene får langt højere karakterer end pigerne i engelsk, så skal man ud til klassen og tale med eleverne. Her er en rangliste alt for tam og ukonkret.

Har man fundet den psykiatriske hospitalsafdeling, der oftest anvender tvangsfiksering, skal man ud og finde en patient, der har ligget fikseret længe, og som på en anden afdeling ville være blevet behandlet bedre.

Når lokomotivførere har fået asbest-lunger, skal man finde ud af, hvor mange det drejer sig om, og man kan finde nogle af dem. Når Grindsted-arbejderne har fået kviksølv-forgiftning, skal man finde dem, der har fået for meget kviksølv.

Større fokus på fejltjek

Normalt betragtes videnskabelige undersøgelser som mere grundige end journalistik. Men på i hvert fald ét punkt er journalistik mere grundigt. I modsætning til forskere arbejder journalister helst ikke med anonymiserede data.

Journalister vil have navn på, og alene dette gør, at deres oplysninger i meget højere grad tjekkes. Er der fejl, er der næsten altid nogle, der opdager det, og man må rette og fortælle det. Journalister hader derfor fejl i deres tekster, uanset om det er sprog eller faktuelle oplysninger

Det samme gælder for de mange data, man putter i grafikker eller lægger på en hjemmeside som for eksempel skolernes gennemsnitskarakterer.

I en videnskabelig undersøgelse kasserer man yderpunkterne og koncentrerer sig om mønstre. Enkelte fejl er ofte uden den store betydning i den type analyser. De rokker ikke ved konklusionen.

Men den går ikke i CAR-journalistik. Derfor har CAR-journalister udviklet en stribe metoder til at tjekke data for fejl, før de bringes. Det er for eksempel at tjekke alle sammenlægninger, udviklinger over år, yderpunkter, og det kan være så langt, som at man vender tilbage og spørger kilden til oplysningens rigtighed.

Vi oplever også, at databaser fra myndigheder er fejlramte i større eller mindre grad. Det kan være så slemt, at man ikke offentliggør data – eller at man fortæller læserne om fejlene og beder læserne være med til at rette fejl, sådan som Philadelphia Inquirer en gang gjorde med databasen over anmeldte forbrydelser, som avisen havde modtaget fra politiet.