Vedlegg 2: Metode

<- tilbake til rapporten

  • Bruk innholdsfortegnelsen under til å navigere i dokumentet.

Undersøkelsen av NRKs nyhetstilbud på Internett i 2009 er gjennomført ved hjelp av flere typer datamateriale, som er underlagt ulike kvantitative og kvalitative analyser. I dette vedlegget redegjør vi for metodiske tilnærminger og valg, vi diskuterer utfordringene knyttet til analysene, og vi forklarer sentrale begrep i analysen. Gjennomgangen skal for det første tjene som en begrunnelse for de metodiske valgene som er foretatt, og slik gi bedre grunnlag for å etterprøve analysene og rapportens konklusjoner. I forlengelsen er det, for det andre, et poeng å synliggjøre særlige metodiske utfordringer ved denne typen undersøkelser både med tanke på framtidige vurderinger av NRKs nettilbud, og med tanke på studier av lignende typer nettinnhold mer generelt.

Gjennomgangen tar først opp avgrensninger og metodiske utfordringer som er felles for prosjektets ulike deler. Deretter redegjøres det i tur for valg og utfordringer knyttet til de tre metodiske tilnærmingene – den automatiserte kvantitative, den manuelle kvantitative og case-studiene. Underveis diskuteres og kontekstualiseres også sentrale begrep fra analysene.

Teksten refererer en del annen forskning innen relevante fagfelt. Dette er ment både å gi pekere til lignende studier, og å klargjøre det teoretiske og metodiske grunnlaget for undersøkelsen.

Avgrensninger og generelle metodiske utfordringer^

Som ved enhver vitenskapelig undersøkelse innebar gjennomføringen av oppdraget valg og avgrensninger. Her redegjøres det i detalj for begrunnelsen for, og konkrete implikasjoner av, de ulike avgrensningene. Avgrensningene kan deles i to: Et sett som utledes av oppdragets utforming, og et sett som er knyttet til øvrige rammebetingelser, særlig tidsrammer og nettet som en ny medieplattform.

Et første sett med avgrensninger følger direkte av oppdragets utforming.

Undersøkelsen ser for det første kun på NRKs tilbud, ikke institusjonelle eller økonomiske aspekt, produksjonsforhold, eller publikums bruk eller opplevelse med bruken av tilbudet. Det innebærer at forhold som institusjonelle strategier og kvantitative brukertall inngår som moment i utvelgelsen av ulike deler av tilbudet som er undersøkt. Men strategier, konsekvensene av økonomiske prioriteringer eller brukermønstre og –opplevelser er ikke i seg selv underlagt analyse.

For det andre konsentrerer analysen seg om NRKs tilbud på Internett. Det betyr at undersøkelsen verken omfatter NRKs kringkastede radio- og tv-tilbud, eller tjenester på andre medieplattformer (for eksempel tekst-tv-lignende tjenester for digital tv-distribusjon og –mottak). Internettilbudet som undersøkes er publisert på plattformen world wide web.

Internettilbud kan i dag være forbundet med en rekke ulike brukssituasjoner. En tradisjonell brukssituasjon er i en kontorstol foran en stasjonær personlig datamaskin på et skrivebord. Med utbredelsen av trådløse Internettforbindelser har bærbare datamaskiner i ulike størrelser i løpet av de seneste årene etablert seg som et populært alternativ. Også ulike portable enheter – personal digital assistants (PDA), audiovisuelle medieavspillere og avanserte mobiltelefoner – blir utstyrt for nettbruk. Slikt mottaksutstyr gjør brukssituasjonen potensielt mer mobil – på bussen, i friminuttet eller på pub’en. Slik bruk stiller også andre krav til brukergrensesnitt og tekniske løsninger fra tilbyderne. I den andre enden av skalaen finner vi sammenkoblinger mellom Internett, tv-apparater og hjemmekinoanlegg. Da brukes Internettjenester gjerne fra sofaen eller godstolen foran en stor skjerm, gjerne med et avansert lydanlegg. En slik bruk vil føre med seg ganske annerledes forventninger til tilbudet. NRKs tilbyr nyheter på Internett til hele spekteret av brukssituasjoner. Selv om det inngår deltilbud i NRKs nyhetsformidling via Internett som er rettet mot spesifikt brukerutstyr eller brukssituasjoner, er det i hovedsak snakk om tilpasning og versjonering for ulike kontekster. Slik er for eksempel værmeldingstjenesten først lansert på nettsiden yr.no blitt tilpasset avanserte mobiltelefoner (for eksempel med egen iPhone-applikasjon). På lignende vis kan for eksempel nett-radio fra NRK overføres i ulik lydkvalitet basert på brukerens nettforbindelse. Undersøkelsen har ikke fokusert på ekstreme brukerscenarioer, og heller ikke gjennomført systematiske tekniske tester av krav til overføringskapasitet eller lignende. Isteden er NRKs nyhetstilbud på nett undersøkt i det som betraktes som en utbredt brukssituasjon: med personlig datamaskin med god Internettforbindelse1.

En fjerde avgrensning gjelder definisjonen av nyheter og nyhetsrelatert innhold. Ettersom nyheter regnes å være legitimerende for en medieorganisasjonen, og særlig for en allmennkringkaster2, er det både av forskningsmessig og offentlig interesse å etablere hva disse nyhetene handler om. Martin Eide sier at ”Nyhetene er erkjent som et konkurransefortrinn og en vesentlig legitimeringsfaktor for et fjernsynsselskap som til være i ”allmennhetens tjeneste’”3. I denne undersøkelsen opererer vi med en bred definisjon av nyhetsbegrepet. På et grunnleggende nivå er nyheter ”det redaksjonelle stoffet som aviser, radio og fjernsyn presenterer for publikum på nyhetssider eller gjennom nyhetssendinger”((Allern, Sigurd (2001) Nyhetsverdier: Om markedsorientering og journalistikk i ti norske aviser, Oslo: IJ Forlagets, s. 52)). De nyheter vi ser på tv og leser i avisen og på nettet bidrar til forståelse av vår komplekse verden og opplyser oss som borgere om hva som foregår i samfunnet på det politiske, kulturelle og sosiale planet4. Som John Ellis påpeker5, er hver nyhet å anse som det siste fragmentet i en lang og uavsluttet historie, en evig oppdatering av hva som har skjedd, og videre spekulasjoner om hva som kommer til å skje. Nyhetene er dermed også en del av vårt daglige ritual6. Nyheter dreier seg derfor ikke bare om aktuelle begivenheter. Nyhetene omfatter også human interest, sport, tabloidjournalistikken, servicejournalistikk og populærkulturelle tema7. Allikevel er ikke nødvendigvis de nyhetene vi får presentert en objektiv representasjon av ting som skjer i verden. Nyheter produseres av institusjoner, er resultatet av journalistiske praksiser og ideologier, og befinner seg i konkurranse med nyheter produsert av andre nyhetsinstitusjoner8.

Nettets fortrinn er muligheten for samtidighet mellom begivenhet og nyhetsformidlingen, derfor er også hendelsesnyheter viktige på nettet – fordi teknologien tillater det. Dermed utgjør også teknologiens muligheter mye av konkurranseforholdene på nettet. Tradisjonelt sett har man ansett forskjellen mellom avis- og fjernsynsnyheter å ligge i hvordan nyhetene er organisert. Der fjernsynssendingen er ment å ses fra begynnelse til slutt, er avisnyheter mer å anse som en meny med større utvalg publikum kan plukke fritt fra9. Nyheter på nettet er enda mer utsatt for og tilpasset publikums valgmuligheter. Nyheter på nettet er derfor ikke å anse som en redigert fremstilling av dagsorden på samme måte som en nyhetssending på fjernsynet. Nyheter på nettavis-lignende nettsteder er i stor grad heldekkende nyheter som tilbyr både hendelsesnyheter, underholdning, informasjon og kuriosa. Det er med dette utgangspunktet vi har tatt for oss nyhetstilbudet på nrk.no i 2009.

For det femte er undersøkelsen avgrenset i tid til 2009. Det innebærer at tilbud som er tilgjengeliggjort senere ikke er tatt med i vurderingen. Alt NRK-innhold produsert før 2009 inngikk selvsagt også i allmennkringkasterens tilbud i 2009 så sant det ikke var fjernet fra nettet eller blitt vanskelig tilgjengelig av tekniske eller andre årsaker. Dette enkle poenget peker på et særpreg ved nettet som medieplattform: I motsetning til for eksempel kringkastet radio og tv er oftest ikke nettilbudet knyttet til ett spesifikt brukstidspunkt definert av tilbyder. Siden undersøkelsen skal brukes i en vurdering av NRKs virksomhet i 2009 var det naturlig å konsentrere analysen om tilbud tilgjengeliggjort i 2009. Der det framstår som relevant har vi i undersøkelsen imidlertid tatt høyde for sammenkoblinger til tidligere produsert, fortsatt tilgjengelig innhold.

Et annet sett med avgrensninger følger av undersøkelsens tidsrammer og nettet som en ny medieplattform.

NRKs tilbud på Internett er i utvikling. Dette betyr at undersøkelser av selskapets virksomhet tilbake i tid risikerer å raskt framstå som utdaterte dersom formålet er å vurdere tilbudet og gi innspill til konkrete endringer. For eksempel gjennomførte NRK i 2009, som vi diskuterer i rapporten, en omlegging av forsiden på hovednettstedet nrk.no. Dette innebar blant annet ny design og nye retningslinjer for prioritering av nyhetssaker. Endringene ble lansert for brukerne på tampen av året. Overført til kringkastet tv vil en parallell kunne være en omstrukturering av Dagsrevyens hovedsending med ny vignett, nytt studiooppsett, flere eller færre nyhetsankere, og nye journalistiske vurderinger som grunnlag for utvelgelse og prioritering av saker. Selv om endringen plukkes opp i undersøkelsen vil hoveddelen av analysen – gitt oppdraget – måtte være basert på den gamle versjonen.

Web’en er en relativt umoden og fremdeles foranderlig arena. Det finnes også kun svært begrenset og tilfeldig arkivering av offentlig tilgjengelig nettinnhold. Slike forhold stiller nye krav til datainnsamling og –håndtering, og legger føringer for visse avgrensninger. De nye kravene følger ikke bare av at mengden innhold er vesentlig mye større, men henger sammen med at innholdet krever en annen type vurdering og sortering. I tillegg er ulike medieformer på Internett svært flyktige. Disse utfordringene blir større når en slik datainnsamling – gitt rammebetingelsene – først kan starte året etter at innholdet er tilgjengeliggjort.

En grunnleggende metodisk utfordring knyttet til innholdsanalyser av Internettkommunikasjon henger altså sammen med forskningsobjektets oppbygning10. Utfordringen gjelder både de som er interessert i det spesifikke ved de nye objektene som enkeltfenomen, og de som er interessert i tekstene som del av en sosial interaksjon.

Som tidligere nye medier byr også nettmedier på tekstlige uttrykk som vi best kan forstå hvis vi ser på de som en blanding av andre teksttyper. Som en rekke forskere har vist: Nettmedier bygger på og re-modellerer uttrykk og genre vi kjenner fra før. Men hva er egentlig objektet for slike analyser? Er det deler av eller hele nettsider, nettsteder, eller kanskje sfærer bestående av flere nettsteder?

De metodiske utfordringene som følger av slike spørsmål kommer klart fram hvis vi vurderer historiske analyser av nettinnhold, som den foreliggende undersøkelsen11. Hvis vi vil studere tekstlige utviklingstrekk i bt.nos eller nrk.nos historie er vi avhengige av et arkiv. Men det finnes ikke noe samlet arkiv for den typen innhold slik det gjør for den trykte utgaven av Bergens Tidende eller for de kringkastede programmene til NRK12. Problemene kan illustrere med to korte eksempler:

  • Selv om tekstbaserte nyhetssaker publisert i løpet av fjoråret fremdeles ligger åpent tilgjengelig som del av NRKs tilbud, og gjerne er merket med publiseringsdato, er det vanskelig å finne ut om og i så fall hvordan en konkret sak ble presentert på forsiden, eller på ulike tematiske eller geografiske samlesider. Var saken et toppoppslag den aktuelle dagen, og i så fall hvor lenge? Overført til vurderinger av kringkastet radio vil en kunne vurdere en individuell nyhetsreportasje, men ikke vite om reportasjen ble kringkastet én gang som sistesak i en distriktssending, eller ble prioritert som hovedsak i flere etterfølgende riksdekkende sendinger. Dette påvirker altså muligheten til å vurdere journalistiske prioriteringer og presentasjonsmessige sammenhenger.
  • Ved enkelte hendelser, som politiske demonstrasjoner eller naturkatastrofer, har NRK i 2009 overført levende bilder direkte som del av sitt nett-tv-tilbud. Et slikt tilbud inngår åpenbart i nyhetsformidlingen og kan være høyt prioritert og tydelig profilert fra NRKs side. Etter hendelsen er ikke innholdet lenger tilgjengelig. Det vil heller ikke finnes tydelige spor etter tilbudet for brukere av NRKs nettilbud, og det kan være krevende å finne slike spor i tekniske logger. Kontrasten sterk til radio og tv: Der arkiverer NRK alt selskapet publiserer – uavhengig av om innholdet er planlagt eller ikke, og om det overføres direkte eller sendes som opptak.

Arkiveringsproblemer er ikke nytt innen medieforskningen. Filmhistorikere har lenge hatt store problem med ødeleggende lagerbranner. Og før utbredelsen av standardisert, billig opptaksutstyr var det mye vanskeligere å samle flyktige radio- og tv-program. Likevel byr analyser av nettinnhold på metodiske utfordringer. Arkiveringen fører nemlig også til problem. Der det subjektive elementet i arkiveringsprosessen for tradisjonelle medier ligger i selve utvelgelsen, vil også innsamlingen av nettinnhold medføre subjektive valg. For det første i valg av arkiveringsmetode og -format; for det andre fordi netteksten forandres – potensielt til og med under arkiveringen; og for det tredje fordi en må sette grenser rundt teksten før arkivering. Skal vi ta med hele nettstedet nrk.no? Inkludert innhold som ligger under andre domener? I hvor mange ledd skal en i så fall følge lenkene?

I undersøkelsen av NRKs nyhetstilbud på nett studerer vi delnettsteder og nettsteder. Nettsted og delnettsted forstås da som en samling sammenhengende nettsider. nrk.no er et nettsted som består av en rekke delnettsteder, for eksempel nrk.no/verden og nrk.no/humor13. Sammenhengen mellom nettsidene som disse nettstedene er bygget opp kan være basert på ulike typer forbindelser. En måte å beskrive dem på er med begrepene semantisk, formal og fysisk performativ14. Enkelt sagt viser begrepene til sammenkoblinger basert på at sidene handler om det samme, at de ser like ut, og/eller at de er koblet sammen med lenker. Slike sammenhenger kan krysse ulike domener og inkludere innhold fra ulike avsendere. Siden undersøkelsen er konsentrert om NRKs virksomhet som tilbyder, er imidlertid analysen avgrenset til delnettsteder som tilbys av NRK (og tilsvarende TV2 i case-studien om dekning av stortingsvalget).

Disse generelle avgrensningene og metodiske utfordringene handler altså om rammene for nettanalyse. Denne undersøkelsen har nærmet seg utfordringene på ulike måter i behandlingen og analysen av de ulike datasettene. I det følgende redegjøres det for karakteren ved de ulike datasettene, samt de konkrete metodiske valgene som er knyttet til analysen av dem.

Om automatisert kvantitativ analyse^

I det følgende redegjøres det for den automatiserte kvantitative metodiske tilnærmingen til analysen av datasett (1) n=74430. Her presenteres metodiske valg både i henhold til utvalg og behandling av data, samt en beskrivelse av utforming av programkode og metode for praktisk gjennomføring av den automatiserte analysen.

Med automatisert analyse menes i denne sammenhengen analyse utført ved hjelp av programvare på en datamaskin. Metoden er begrenset til skriftlige medier. Analysen er automatisk i den forstand at et skript registrerer egenskaper ved tekstene, i motsetning til manuell analyse der mennesker gjør den samme  jobben. I denne undersøkelsen, i likhet med mange andre studier som benytter maskinell koding, er den automatiserte maskinelle analysen et supplement til manuell koding15.

Motivasjonen for å bruke automatiserte metoder i analysen av NRKs nyhetstilbud på nett er å kunne analysere en større del av materialet enn det som lar seg gjøre i en manuell analyse. Metoden åpner for å analysere hele materialet i motsetning til et utvalg. Ved å telle tekstenes bestanddeler via programkode kan vi samle kvantitativ kunnskap som ville være svært ressurskrevende å hente inn manuelt. Med en slik metode unngår man også feil av den typen mennesker kan gjøre når de blir slitne eller stresset, og selve analysen går svært hurtig når programkoden først er skrevet. Ulempene ligger i at metoden krever programkode spesielt tilpasset NRKs websider, og at feil eller mangler i seleksjonen av en teksts bestanddeler kvantifiseres som alle andre utvalgte variabler. Tiden det tar å skrive programkoden utgjør likevel bare en brøkdel av tiden det ville tatt å kode tekstene manuelt, og både manuell og automatisert koding vil kunne inneholde feil. En automatisert analyse lar oss samle så mye kunnskap om nyhetstekstene som mulig innenfor prosjektets rammer. For webmediet anser vi metoden som framtidsrettet, og den er godt egnet for de oppgavene innen innholdsanalyse som innebærer å registrere strukturelle og formelle egenskaper ved tekst – i denne studien nyhetstekster.

De strukturelle egenskapene ved en tekst legger tunge føringer på hva slags kunnskap vi kan framskaffe med denne metoden, som baserer seg på maskinelt plukke ut gjenkjennelige strukturelle elementer. Å se programkodens begrensninger er en forutsetning for å avklare hva slags kunnskap vi kan framskaffe med denne metoden.

En webtekst slik programkoden leser (parser) den^

I analysen av en potensielt heterogen mengde tekster bruker vi en beskrivelse som favner vidt. Vi definerer en enhet (artikkel) som et HTML-dokument med en unik URL, som består av en rekke ulike bestanddeler. Disse omfatter tradisjonelle enheter som overskrifter, brødtekst og bildetekster, så vel som kontekstbokser (liste over relaterte tekster), faktabokser, video- og lydfiler, flashelementer, spørreundersøkelser, kommentarfelt og lenker. Metadata som publiserings- og oppdateringsdato og tidspunkt samles inn, men regnes ikke som en del av nyhetsteksten/saken. Vi regner ikke med tekstens /sakens visuelle kontekst (websidens design og menystruktur), elementer som går igjen i alle tekstene (som knapper for utskrift eller deling via e-post eller sosiale nettverkstjenester), eller reklame. Tekstenes og medhørende bilde-, lyd- og videofilers meningsinnhold fanges ikke opp. Programkoden leser egenskaper fra websidens URL og HTML. Enkelte variabler har vi plukket fra URLen, som nyhetskategori og lokalkontor, mens andre variabler hentes fra websidens markup (HTML), som lenker, publiseringsdato og -tid, bildekaruseller og medieavspillere. Disse bestanddelene som til sammen utgjør en enhet, en artikkel, er valg delvis med bakgrunn i eksisterende kodebok for innholdsanalyse og delvis på bakgrunn av eksperimentering rundt hvilke elementer vi klarte å utforme gode, generelle men presise, selektorer for i programkoden. Vi ha forsøkt å fragmentere tekstene så mye som mulig, for å omfatte flest mulig nye webspesifikke fortellergrep.

I praksis har vi samlet inn alle nyhetstekster fra 2009 på nrk.no som vi har kjennskap til, og maskinelt hentet ut egenskaper ved tekstene som beskriver kvantitative egenskaper i dem. Eksempler på slike egenskaper er antall ord, bruk av leserkommentarer, lyd- og videoelementer, lenker og bildeserier16. Analysen gir oversikt over slike bestanddeler i hele datasettet, men sier ingenting om tekstenes meningsinnhold. Den er derfor å regne som et supplement til den manuelle kvantitative analysen, hvor man kan skille mellom nyhetssaker om kultur og nyhetssaker om kriminalitet, og gjøre andre typer skjønnsmessige vurderinger og klassifiseringer.

Beskrivelse av analysen^

Den automatiske innholdsanalysen av NRKs nyhetstilbud på nett er altså resultatet av å maskinelt hente ut relevant informasjon fra artiklenes HTML-kode. Prosessen kan grovt deles inn i tre:

  1. Innhøsting, seleksjon og utvalg
  2. Preprosessering, programmering og kontroll/etterprøving av programkode
  3. Kjøring av programmet på datasettet, og tolking av data

Innhøsting, seleksjon og utvalg^

Det analyserte materialet fikk vi direkte fra NRK i form av lister med URLer, og før innsamlingen av selve artiklene definerte vi et subsett med URLer som er brukt som grunnlag for den automatiserte analysen. Vi ble i første omgang introdusert for en hovedindeks med 500 subindekser. Subindeksene var igjen URL-lister, og skulle omtrentlig omfatte alle nrk.nos publiserte tekster. I indeksene står hver URL oppført som et “oppslag” med en viss mengde informasjon knyttet til seg, noe som gjør det mulig å plukke URLer fra basert på ulike kriterier. Hvert URL-oppslag inneholder for eksempel informasjon om siste oppdateringstidspunkt, og man kan dermed se at artiklene i indeksene er oppdatert mellom 2000 og 2010 (nærmere bestemt mellom 03.02.00 og 08.02.10).

Eksempel på et URL-oppslag fra indeksen:

<url>

<loc>http://www.nrk.no/nyheter/distrikt/ostfold/1.6441500</loc>

<lastmod>2009-01-20T15:01:32+01:00</lastmod>

<changefreq>never</changefreq>

<priority>0.5</priority>

</url>

Med siste oppdateringsdato tilgjengelig kunne vi plukke ut alle URLer som ble oppdatert i løpet av 2009. Utvalget av artikler fra disse indeksene er altså ikke basert på informasjon om publiseringsdato fra artiklene, men på datoinformasjon i selve indeksen. Dette betyr at det må regnes en viss feilmargin hva gjelder dato for disse artiklene, 4% av tekstene som er analysert har en publiseringsdato som ikke ligger i 2009. Selv om vi i utgangspunktet var interessert i saker som er publisert første gang i tidsrommet 01.01.2009 til 31.12.2009, er det relativt uproblematisk å basere utvalget på oppdateringsdato fordi de fleste artiklene er både publisert og sist oppdatert samme dag. Vi vil ha gått glipp av noen artikler som er publisert på en av “våre” datoer,  men oppdatert på en senere dato; men har fått tilsvarende tilbake i form av artikler som er publisert på tidligere datoer (f. eks. i desember 2008), men sist oppdatert på en av våre. Alternativet til denne utvalgsmetoden ville være å hente inn alle artiklene fra de 500 indeksene, for så å plukke dem ut på faktisk publiseringsdato hentet fra HTML-koden. Siden indeksen inneholder en halv million (502 180) URLer, var dette uaktuelt både av tids- og plasshensyn. Det tok nærmere fem døgn å samle inn 75 000 nettartikler fra 2009, og disse artiklene opptar 4.2 GB lagringsplass på vår server.

Materialet fra de 500 indeksene inneholder 73 454 unike pekere til tekster publisert i 2009. Et stykke ut i analysen ble det klart at disse URLene ikke utgjorde det hele og totale materialet fra 2009, for eksempel var det et tilnærmet fravær av økonominyheter (én eneste URL). Etter dialog med NRK fikk vi ettersendt lister med URLer til artikler fra nrkbeta.no, nrkp3.no og juntafil.no, økonomiartikler fra hele 2009, samt artikler fra 14 datoer vi hadde spesifisert med tanke på den manuelle kvantitative analysen. Det totale materialet omfatter om lag 76 000 (75 987) unike URLer fra 2009. Det faktiske, totale antallet publiserte tekster i 2009 er for oss, så vel som NRK selv, ukjent. Årsaken til dette er at NRK benytter flere ulike publiseringssystemer som ikke er koblet sammen verken med noen felles lagringsløsning eller aggregering av produsert materiale. Det er likevel rimelig å anta at det analyserte materialet i mengde ikke er veldig langt fra nrk.nos totale tekstlige nyhetspublisering på web i 2009.

Innsamlingen av materialet ble utført ved at HTML-dokumentene ble lastet ned fra web til en lokal server. Innhøstingen ble gjort med varsomhet, og algoritmen inneholder elementer av ventetid slik at NRKs servere ikke skulle overbelastes av våre 75 000 henvendelser på relativt kort tid. Til innhøsting av artikler brukte vi GNU Wget17, som er en fritt tilgjengelig programvare for nedlasting av websider. Wget tar URLer som input, og laster ned HTML-kode ved å lage en lokal kopi og skrive denne til en fil. Systemet har opsjoner som gjør det mulig å skreddersy innhøstingsprosessen etter behov. Blant annet kan man velge å skrive all innhøstet kode til én eneste stor fil, eller til separate filer, slik vi har funnet hensiktsmessig siden vi skal studere enkeltsaker. Videre analyse av filene ble utført på den lokale maskinen.

Av ulike årsaker var noen av URLene i datasettet ikke egnet som grunnlag for automatisk analyse. Artiklene fra nrkbeta-, juntafil- og nrkp3-indeksene er publisert med et annet publiseringsverktøy, og har derfor en annen HTML-struktur enn de øvrige artiklene. Siden URLene til disse artiklene kom oss relativt sent i hende hadde vi ikke kapasitet til å tilrettelegge for automatisk analyse av disse. En manuell gjennomgang av artiklene viste dessuten at det var svært få av disse artiklene som faktisk kunne kategoriseres som nyhetssaker. Dette gjaldt særlig blant juntafil-artiklene. En del av artiklene i de andre indeksene som heller ikke møtte kriteriene for en nyhetssak, ble fjernet på grunnlag av visse mønstre i URLen. Indeksene inneholdt dessuten både inaktive URLer og URLer uten unik id, og disse ble også fjernet.

Et siste forhold som berører utvalget av URLer er duplikater. Duplikat betyr i denne sammenhengen at samme URL, eller samme unike id i en URL, forekommer flere steder i datasettet. Den siste typen duplikater er resultat av at den unike id-en er brukt i ulike kontekster, og oppstår når nyhetssaker presenteres under ulike kategorier eller tematiske delnettsteder på nrk.no. Slike artikler har ulikt semantisk innhold i URLen, men samme unike id. I dette eksempelet vil de to URLene i prinsippet være én sak, presentert i ulike kontekster:

http://www.nrk.no/nyheter/okonomi/1.6923373

http://www.nrk.no/nyheter/norge/1.6923373

Duplikater finnes både internt i URL-listene og listene i mellom, men vi har ikke kartlagt hvor det finnes overlapp eller i hvilken grad dette gjelder duplikater av hele URLer eller gjenbruk av unike id-er. Vi fjernet duplikater ved å slå sammen alle listene, sammenligne alle id-er, og ta bort URLer med id-er som forekommer mer enn én gang i listen18. Resultatet er et normalisert sett med unike saker.

Utvalget som er grunnlag for den automatiserte innholdsanalysen består altså av unike saker fra hovedindeksen, listen over økonomi-saker og NRKs eget 14-dagersutvalg19. URLer uten id, av typen http://www.nrk.no/programmer/tv/, viste seg metodisk problematiske fordi selve URL-en går tapt ved nedlasting av HTML-koden, slik at det ikke er mulig å etterprøve den automatiserte analysen av disse artiklene.

Programvaren som laster ned HTML-sidene fra web navngir filene med innholdet etter siste slash (/), altså URLens unike identifikator:

http://nrk.no/nyheter/verden/1.6911480 -> 1.6911480

URLer som ikke har en unik id har heller ikke noe innhold etter siste slash, og får derfor defaultnavn av formen ’index’, et unikt siffer, og en HTM-ekstensjon:

http://www.nrk.no/programmer/tv/ -> index47.htm

Når vi etter nedlasting skal koble HTML-filen til dens respektive URL har vi brukt filnavnet til å finne tilbake til URL-en ved å søke etter filnavnet (den unike id-en) i den store listen med URL-er. Man kan også søke etter URL-en i filens HTML-kode, men de omdøpte ”index”-filene inneholdt verken URL, tekstelement eller informasjon om publiseringsdato. Dette er fordi de hverken er nyhetssaker eller andre saker, men pekere til indekssider, samlesider, informasjonssider og lignende. Det var derfor uproblematisk å fjerne disse 341 artiklene fra utvalget.

Ut over dette viste det seg vanskelig å forutsi hvilke URLer som pekte til nyhetssaker utelukkende basert på innhold i URLen og andre strukturelle egenskaper ved filene. I den manuelle kodingen avtegnet det seg riktignok en del tendenser, vi observerte for eksempel at faktorer som artikkellengde, manglende elementer i HTML-koden og spesifikke uttrykk i URLen kunne indikere om en artikkel var nyhet eller ikke. Et konkret eksempel er artikler uten et artikkelelement20 i HTML-koden, som er det elementet som inneholder store deler av den informasjonen vi henter ut; blant annet nyhetsteksten. Slike saker viste seg å stort sett være bildeserier. De kunne identifiseres automatisk ved det manglende artikkel-elementet, men siden noen slike artikler i den manuelle analysen ble kodet som nyheter og andre ikke,  kunne vi ikke fjerne dem fra datasettet. Kun enkelte mindre grupper tekster fjernet vi med pga innhold i URLen, eksempelvis nrk.no/design_og_handverk som vi ikke fant eksempler på at inneholdt nyhetsstoff.

Denne typen vurderinger, basert på artikkelens semantiske innhold, lar seg vanskelig utføre automatisk uten å anvende spesielle metoder for automatisk klassifisering av tekstuelt meningsinnhold. Dette er hovedgrunnen til at maskinelle analysemetoder oftest er kvantitative og ikke kvalitative, og brukes som supplement til manuell analyse. Automatiserte kvantitative analyser kan likevel avdekke tendenser, og bekrefte eller avkrefte antagelser om tendenser i materialet.

De artiklene som ble fjernet fra utvalget i den autmatiserte analysen var dermed duplikater, og av praktiske og metodiske hensyn, URL-er uten unik id. Det endelige datasettet består av 74430 unike URLer.

Preprosessering, programmering og kontroll/etterprøving av programkode^

Første steg i programmeringsprosessen var å identifisere de elementene i artiklenes HTML-kode vi ønsket å kvantifisere. Dette måtte gjøres manuelt. Seleksjonen av elementer er utført ved å studere artikler på nrk.nos sider i en nettleser og se etter elementer som svarer til variablene i kodeboken. Størsteparten av programmeringsarbeidet besto dermed i å identifisere elementer ved å undersøke og registrere hvordan ulike egenskaper ved tekstene var kodet i HTML-filene. I programmeringsfasen kan vi kalle denne prosessen å definere selektorer. Letingen etter elementer ble utført delvis ved å navigere arbitrært rundt på nrk.no, og delvis ved å søke på portaler der spesifikke elementer kunne tenkes å forekomme mer frekvent enn ellers. For generelle egenskaper som publiseringsdato, artikkeloverskrifter osv. trengte vi bare å se på et fåtall artikler. Vi identifiserte elementene ved å søkte bokstavlig i HTML-koden etter datoen, tittelen osv. som vi kunne se i visningen av artikkelen i en nettleser. Ved identifisering av mer spesifikke elementer, for eksempel videoelementer, lette vi i artikler publisert på NRKs delnettsted nrk.no/spiller. Spiller-artikler er rettet mot brukere av dataspill, som kan antas å være i målgruppen for bruk av denne typen interaktive elementer. Vi fant også eksempler på videofiler i artikler på hovednettsidene. Seleksjonene er etterprøvd ved å testkjøre programkoden på et mindre utvalg artikler, for så å kontrollere at elementene registreres korrekt. Siden samme type element kan kodes på ulike måter, har vi gjennomført stikkprøver for å forsøkte å sikre at vi ikke har oversett noe i defineringen av selektorer.
Koden som er skrevet for dette prosjektet er skrevet i programmeringsspråket Python21. Valg av programmeringsspråk har ingen påvirkning på resultatet av analysen, så lenge behandlingen av tekstene gjøres etter samme formelle definisjoner, og språkene har tilstrekkelig utrykkskraft. For å selektere egenskapene beskrevet i kodeboken er det benyttet ulike teknikker, hvorav de fleste teller eller plukker ut egenskapene fra tekstenes markup, HTML. Til hjelp med selektering av egenskaper ble HTMLparseren Beautiful Soup22 benyttet. Denne parseren retter opp eventuell ukorrekt HTML og lar oss hente ut strukturelle elementer i tekstene ved hjelp av selektorer formalisert av parseren. På tross av parserens bidrag til å rette opp feil i markupen vil metoden være sårbar for disuniform strukturell utforming av nrk.nos mange delnettsteder og nettprosjekter.

Eksempel på seleksjon og telling av spørreundersøkelse:

if soup.find(“div”, { “class” : “article” }) > -1:

article = soup.find(“div”, { “class” : “article” })

for tag in article.findAll():

if tag.name == ‘h3’ and tag.renderContents() == “Gi din karakter:”:

poll = poll + 1

interactive = interactive + 1
Eksemplet over viser seleksjonen av HTML-element med klassen ”article”, hvori det søkes etter en overskrift (h3) som matcher teksten ”Gi en karakter:”. Hvis denne finnes legges 1 til variablene poll og interactive (for interaktivt element). Da spørreundersøkelser publiseres i et innholdshåndteringssystem med en designmal som gjør dette likt hver gang, lar elementet seg telle på denne måten.

Å skrive selektorer for en standardisert mal (designet kan endres, men strukturen er lik) er en oppgave som er rask og effektiv, og som gir sikre resultater, men endringer i malen vil ofte også medføre behov om å endre selektorene som henter ut tekstens delelementer. Derfor er en analyse av den HTML-koden nrk.no består av ikke det optimale analyseobjektet. En analyse av en databasedump eller tilsvarende uniformt strukturert materiale vil kunne gi bedre resultater. nrk.nos nyhetstekster følger dog en relativt rigid og strukturelt forutsigbar mal, slik at en analyse er greit gjennomførbart. nrk.no publiserer som nevnt mye ut over nyheter på nett, og en bredere analyse vil fordre mer programkode tilpasset nrk.nos andre designmaler og publiseringssystemer.

Interne prosedyrer for hvordan publiseringssystemet til NRK brukes kan tidvis gi utslag i denne metoden. Eksempelvis mistenker vi at ikke nrk.no kollektivt ikke siterer eksterne nyhetsbyrå likt. I de fleste tilfeller krediteres tekster med navnet på eksternt nyhetsbyrå mellom parenteser under artikkelen i en cite-tag23, andre ganger finnes det ingen cite-tag mens teksten likevel oppfattes som en notis fra et nyhetsbyrå. Noe så enkelt som om et felt fylles ut eller ikke i NRKs publiseringssystem vil skille mellom om algoritmen oppdager egenskapen eller ikke. Dette vil kunne påvirke resultatene ved at tekster som er syndikerte nyhetsbyrå-saker som krediteres i artikkelteksten eller ikke krediteres, telles som ”ikke nyhetsbyrå”, som igjen tolkes som NRK-produsert materiale i analysen.

Den maskinelle analysen bygger tett på vår definisjon av en nyhetstekst, og er kun designet til dette bestemte formålet i nrk.nos mal for nyheter.

Kjøring av programmet på datasettet, og tolking av data^

Før analyse gjorde vi en siste tilrettelegging av materialet ved å systematisk fjerne overflødige elementer i HTML-koden. Såkalt ”boilerplate removal” er en velkjent utfordring i innhøsting og håndtering av informasjon fra større mengder tekst på web, og det er ønskelig fordi man ved å fjerne kode kan korte ned tiden det tar å prosessere materialet maskinelt24. Deler av innholdet i artiklene på nrk.no er gjennomgående og ikke artikkelspesifikt. Vi skrev derfor programkode som fjernet en del slike elementer fra HTML-koden. På samme måte som vi identifiserte andre egenskaper i HTML-koden, fant vi elementer som er felles for alle artiklene, og ekstraherte dem fra koden. Denne preprosesseringen reduserte filstørrelsen med nærmere 40%. Dette ble utført kun på artiklene fra ”hovedindeksen”, dvs. den første indeksen vi fikk tilsendt, som utgjør brorparten av materialet.

Siste trinn i analyseprosessen var å kjøre programkoden på hele datasettet. Skriptet går gjennom all HTML-koden og kvantifiserer (registrerer og teller) egenskapene til våre 74 430  artikler. Dette tar om lag 6,5 timer. Resultatet av analysen er en stor (.csv)fil der hver artikkel er kodet som en rad med tabulatorseparerte verdier for hver variabel i kodeskjemaet. Å gå veien om .csv25 viste seg svært nyttig da dette formatet enkelt kan flyttes mellom ulike verktøy som SPSS, MS Excel og andre mer generelle databasesyster. Tolkningen av dataen ble støttet av flere slike verktøy, med fordelen ved at der et verktøy ikke strekker til kan vi benytte et annet. Til flere av forskningsspørsmålene viste det seg formålstjenelig å gjøre SQLspørringer mot materialet i en database.

Om manuell kvantitativ analyse^

I det følgende redegjøres for kvantitativ innholdsanalyse som metode for å undersøke datasett (2) og (3) – innholdsanalysen n=2162 og forsideanalysen n=1192. Her presenteres metodiske valg, analysedesign og metodiske utfordringer med kvantitativ innholdsanalyse for nyhetsinnholdet på nrk.no i 2009. Ettersom forsideanalysen og innholdsanalysen er gjennomført basert på samme design, behandles begge analysene samtidig.

Innholdsanalyse er en forskningsmetode for å gjennomføre undersøkelser om medieinnhold etter valide metoder. Dette innebærer blant annet at målingene er gjort på et representativt utvalg, at undersøkelsen er systematisk gjennomført, valid og kan gjentas med samme forventede resultat. Statistiske metoder tas i bruk for å trekke summerende, generaliserbare og kontekstuelle slutninger fra materialet fra undersøkelsen26. Innholdsanalyser blir derfor gjerne gjennomført for å kunne si noe om medieteksters innhold, form, produksjon, resepsjon og effekt. Man kan altså bruke innholdsanalyser til å bistå i analyser om medietekster, til å beskrive medieinnhold, eller til å teste hypoteser om disse27.

I denne studien har vi brukt kvantitativ innholdsanalyse til å beskrive nyhetsinnholdet på nrk.no i 2009, og for å trekke generaliserbare og kontekstuelle slutninger om materialet. Dette har vi gjort på bakgrunn av et sett med forskningsspørsmål. Undersøkelsen er i stor grad beskrivende. Dette er derfor en survey som skal måle forekomsten av variabler ettersom de oppstår28. En survey som dette er ansett å ha en høy grad av generaliserbarhet når undersøkelsen er basert på et tilfeldig utvalg, som i vår studie.

Utvalg^

Den kvantitative innholdsanalysen forholder seg til tre ulike datasett. Det første datasettet er resultat av en automatisert analyse beskrevet over. De to andre datasettene utgjør et representativt utvalg av nyhetsproduksjonen på nettet og på forsiden nrk.no i 2009 og består av en konstruert 10-dagersperiode. Søknaden om oppdraget la opp til en konstruert 14-dagersperiode, men da det raskt ble klart at tiden ikke ville strekke til i forhold til å gjennomføre både en forsideanalyse og en innholdsanalyse, ble utvalget skalert ned til 10 dager. Datoene var allerede forhåndsbestemt, og 4 dager ble fjernet fra analysegrunnlaget slik at vi satt igjen med en mandag, en tirsdag, to onsdager, to torsdager, to fredager, en lørdag og en søndag, en dag for hver måned, utenom mai og juli, 200929.

Det har vært viktig at ulike ukedager og måneder er representert i utvalget ettersom nyhetsproduksjon tradisjonelt sett er noe ulikt i henhold til når på døgnet, når i uken og når på året man undersøker. I utvalget tok vi derfor høyde for og luket ut spesielle dager hvor man kunne forvente at nyhetsbildet ikke var representativt for året som helhet. Dette omfattet blant annet datoene for Obamas norgesbesøk, romjulen, påsken og ukene før og etter stortingsvalget. På den andre siden er nettets formidlingsformer tilpasset både bredde og dybde på en sånn måte at det også er viktig å unngå å utelukke nyhetsdager som domineres av tunge enkeltsaker. I tillegg ble datoene for dybdeanalysen valgt ut i henhold til tilgang til forsidebilder fra samme dag.

Både innholdsanalysen og forsideanalysen er utført gjennom manuell koding basert på etablerte kategoriseringer for innholdsanalyse av nyhetsinnhold, og tillater dermed en viss grad av tematisk komparasjon med tidligere innholdsanalyser av nyheter fra avis og TV i Skandinavia30. De to analysene er designet etter samme prinsipp og er dermed sammenlignbare. Kodingen av innholdsanalysen og forsideanalysen er foretatt i det statistiske analyseprogrammet STATA. Kodingen har på grunn av ressurssituasjonen i hovedsak blitt gjennomført av én koder. Materialet som har blitt kodet i innholdsanalysen består av artiklene slik de ble publisert i 2009. Dette materialet har vi hatt tilgang på gjennom URLadressen til hver publiserte artikkel. Hver URL (og dermed hver publiserte artikkel i utvalget) utgjør én analyseenhet som igjen utgjør én linje i analyseprogrammet. Materialet som har blitt kodet i forsideanalysen består av JPG-filer. En JPG-fil utgjør ett bilde av én forside på nrk.no i sin helhet. En sak på forsiden (bilde + overskrift) utgjør én analyseenhet og dermed en linje i kodeskjema. I forsideanalysen er kodingen begrenset til de 10 første sakene. Nummerering av saker i henhold til prioritering på forsiden er gjort i leseretning (øverst til nederst, venstre mot høyre).

For å oppnå generaliserbare og representative resultater i tråd med undersøkelsens begrensede tidsramme, har vi avgrenset analysene etter gjennomførbarhet. Vi mottok fra NRK i gjennomsnitt 24 forsidebilder fra nærmest hver eneste dag fra 2009 – ett bilde pr time. Selv om det ideelt sett ville være interessant å undersøke oppdateringsraten på forsiden i løpet av et utvalg bestående av hele døgn, så vi oss allikevel nødt til å begrense forsideutvalget til 09:00 til 19:0031 – altså 11 forsider pr døgn. Tidsutvalget er basert på antakelser om nettrafikk og publiseringsfrekvens i NRK generelt sett. Materialet inkluderer derfor de viktigste nyhetsdeadlines innen audiovisuell nyhetsproduksjon i NRK, som distriktssendingene, Dagsnytt 18 og Dagsrevyen. Fra materialet har vi også utelatt enkelte type saker som ikke er for nyheter å regne. Dette gjelder for eksempel administrative sider med spesifikk informasjon om NRK som organisasjon, design- og håndverksider, blogger og programomtaler32.

Analysedesign^

Ettersom det gjerne sies at det ikke finnes noen rett måte å gjøre innholdsanalyse på, må hver analyse designes i henhold til hvilke metoder som passer best til å løse de problemene eller spørsmålene man har skissert33. Da vi i dette prosjektet har vært ute etter å vurdere NRKs nyhetsinnhold på nettet i henhold til NRKs vedtekter for nyhetsformidling, var det nødvendig å foreta kvantitative målinger av utvalgte parametere som deretter igjen vil kunne la seg analysere i henhold til vedtektene.

Da det ikke forelå analysedesign fra tidligere innholdsanalyser av nyhetsformilding på nettet som kunne tilpasses denne analysen, har det vært nødvendig å basere kodeboken på tidligere kunnskap om nyhetsinnhold i det norske medielandskapet på et generelt nivå. Selv om det finnes kvantitative analyser av nyhetsinnhold i norske aviser34, valgte vi å basere denne studien på Waldahl, Bruun Andersen og Rønnings studie av fjernsynsnyheter i NRK og TV 235, sist presentert i boken TV-nyhetenes verden (2009). Dette valget var basert på det faktum at Waldahl et als analysedesign har blitt brukt over flere år, sist i 2007, noe som også betydde at dette også var den nyeste relevante studien. I tillegg var rasjonale for å bruke Waldahl et al som grunnlag for vårt eget analysedesign at vi her har å gjøre med nyhetsproduksjonen til NRK – en kringkaster. Antakelsen var at NRKs nyhetsproduksjon på nettet ville reflektere nyhetsinnholdet på fjernsyn, noe som kun viste seg å stemme i noen grad. Så selv om analysedesignet har fungert som ønsket og tillatt oss å oppnå svar på prosjektets problemstillinger, har det også vært nødvendig å justere kodeboken både i forkant av, underveis i, og etter kodingsprosessen.

En del medium-spesifikke justeringer av kodeboken ble gjort i forkant av kodingsprosessen. En generell orientering på nrk.no og en kort pilotstudie tillot oss å etablere hvilke nettspesifikke og nyhetsrelaterte elementer som lot seg kode av den automatiserte analysen, og hvilke slike markører som best lot seg kode av den manuelle analysen. De tekniske variablene vi spesielt var nødt til å designe fra bunn var de nettspesifikke nyhetsmarkørene, som interaktive elementer og oppdateringsfrekvenser. Da det tilrådes at i man i tilfeller hvor man måler nye typer innehold inviterer profesjonelle kommentarer til analysedesignet36, opprettholdt vi også løpende kontakt med NRK under hele prosjektperioden. Denne kontakten tillot oss å særlig å få avklart spørsmål i forhold til hvordan materialet er lagret i systemet, noe som var viktig for å kunne klargjøre hva resultatene kunne si noe om.

Ethvert utvalg av materiale vil være påvirket av hvilken profil mediet har. Slik vil også analysedesignet være tilpasset kanalen som studeres37. Dette er ikke bare uunngåelig, men også nødvendig for at man skal få svar på forskningsspørsmålene. Enkelte ting som i utgangspunktet ble tatt med i variabeldesignet for denne undersøkelsen av nyhetsinnholdet på nrk.no, ble fjernet underveis fordi det viste seg å være altfor tidkrevende38 gitt prosjektets begrensede tidsramme. Andre aspekter ved nyhetsformidlingen på nrk.no var såpass spesifikke at vi også så oss nødt til å legge til enkelte variabler underveis for å sikre at relevant innhold ble registrert. Dette gjelder tekniske variabler som registrering av oppdateringsfrekvens, kontekstbokser og ”Les/Les også”- bokser, samt innholdsvariablene ”medier” (under kultur og underholdning), ”forseelser/småkriminalitet” (under kriminalitet) og ”samferdsel” (under sosiale spørsmål). Disse ekstra innholdsvariablene var nødvendig å legge til i etterkant av kodingen, da hovedvariablene her viste seg å inneholde store utslag under kategorien ”Annet”. For at analysen skulle kunne gi et informativt bilde av innholdet på nrk.no i 2009 var det altså nødvendig å gå tilbake å rekode ”Annet”-materialet i henhold til disse nyopprettede innholdskategoriene, noe som også ga et mer korrekt bilde av innholdet.

Dette utgjør et av de metodiske hovedfunnene som har kommet ut av denne analysen. For det første er det å analysere nettinnhold ikke det samme som å analysere nyhetsinnhold på fjernsyn eller radio eller i avis. De tradisjonelle mediene har en begrenset publiseringsplass som nettet ikke har. Derfor er det også større variasjon i hva slags innhold man finner på nettsteder som nrk.no, fordi det ikke er plassbegrensninger. For det andre er det å analysere den store mengden lokal- og regionalnyheter som publiseres på nettet av NRKs distriktskontorer ikke det samme som å analysere nyhetsinnhold publisert på en nasjonal nyhetsplattform som NRK Dagsrevyen eller TV 2 Nyhetene. Metodeanvendelsen i denne studien viser at lokalnyheter har et ganske annet tematisk tilsnitt enn riksnyheter. Nettopp derfor var det nødvendig å i ettertid opprette innholdskategoriene ”forseelser” og ”samferdsel”, fordi slike saker ofte når opp på en lokal dagsorden, mens de i en nasjonal nyhetssammenheng er såpass sjeldne at de faktisk hører hjemme under ”Annet”.

I etableringen av en kodebok bør man ta høyde for både analyseobjektet – altså nyheter – og det mediet hvor analyseobjektet formidles. I denne analysen har begge aspekter vært viktige. Spørsmålet er ikke bare hva som spesielt karakteriserer nyhetsformidling i nettmediet og hvordan man fanger opp dette, men også hvilke vedvarende trekk ved nyheter og ved nyhetsjournalistikken som overlever i overgangen fra ett medium til et annet. Nyhetsmediene har tross alt ikke bare unike karakteristika, men ligner hverandre på mange viktige måter, spesielt med tanke på nyhetssjangeren, formidlingsformer, journalistiske standarder og overgripende institusjonelle praksiser. Derfor har vi også vurdert et analysedesign som er basert på nyhetsformidling i et tradisjonelt fjernsynsmedium, med tilpassninger til denne nett-studien, som et valid analysegrunnlag.

Variabler for manuell innholdsanalyse^

Innholdsvariablene i undersøkelsen forutsetter en kvalitativ vurdering fra koderens side når det gleder hovedtema i artikkelen – med andre ord foreligger det problemer med å oversette kvalitative observasjoner til kvantitative data. Som Sigurd Allern påpeker, ”I praksis vil det finnes en rekke mulige grensetilfeller som kan gjøre kodingen komplisert og åpne for at ulike kodere vil treffe ulike valg, eller for den del at samme koder kan bli inkonsistent i sine valg. I slike tilfeller blir resultatet lav reliabilitet”39. Ettersom slik vurderingen innebærer skjønn, kan ”ren” objektivitet vanskelig oppnås. Derfor er det viktig med en grundig kodebok som avklarer gråsonene. I det følgende beskrives grunnleggende forhold ved kodingen, samt de viktigste utfordringene med variablene i innholdsanalysen. Variablene er beskrevet i vedlegg 3.

For både forsideanalysen og innholdsanalysen er det etablert 9 primærkategorier som videre spesifiserer innholdets tematikk i underkategorier: økonomi; kriminalitet; sosiale spørsmål; politikk; ulykker; kultur og underholdning; sport; vær og teknologi og vitenskap. Nyhetene har blitt kodet i henhold til sakens vinkling, og kategoriene er gjensidig utelukkende. I hovedsak er kategoriene designet i henhold til hva saken omfatter tematisk sett, og ikke hvem saken omfatter. I tilfeller av tvil har koderne blitt bedt om å stille seg spørsmålet ”hvorfor er denne saken dekket”? Dette spørsmålet har særlig vært veiledende i tilfeller der politiske saker glir over i generelle sosiale spørsmål.

I de tilfeller hvor det kan sies å eksistere flere vinkler i en sak, er dette kodet med en hovedvinkling og en eller flere sekundærvinklinger. Et eksempel på en sak som faller inn under flere tema er Røkke/Aker-saken som utspilte seg høsten 2009. Her handler det både om politikk, økonomi, og spørsmål om eventuelt kriminelle forhold. Et annet eksempel på en slik sak er Telenor/Vimpelcom-saken, som både handlet om Norges politiske forhold til Russland, økonomiske forhold og juridiske forhold. I slike tilfeller er koderne bedt om å registrere én hovedvinkling, og en eller flere sekundærvinklinger via ”også…” kategoriene som finnes i hver av de tematiske underkategoriene40.

I tillegg oppsto det tidlig i prosessen to særlige problemer i forbindelse med koding av miljørelaterte saker, og i forbindelse med kodingen av saker som involverte statsadministrative enheter – særlig da politiet. I disse tilfellene ble det bestemt at miljøsaker med vinkling på klimakrisen skulle tilhøre primærkategorien ”sosiale spørsmål” og underkategorien ”globale og internasjonale sosiale spørsmål”. Saker som involverte statsadministrasjon på utøvende maktnivå – altså politi og forsvar – ble plassert under ”politikk” og ”norsk innenrikspolitikk”41.

Den siste innholdsvariabelen ”Teknologi og vitenskap” har registrert saker som omhandler teknologiutvikling og naturvitenskapene som ikke er forbrukersaker eller økonomi- eller industrirelatert. Herunder forskningsnyheter innen alle vitenskaper. Teknologi og vitenskap er ikke et saksfelt som vanligvis kodes i innholdsanalyser som dette, heller ikke i studien til Waldahl et al som dette analysedesignet bygger på. Men da NRK opererer med en egen kategori kalt teknologi og vitenskap på sin globalmeny på nrk.no, fant vi det naturlig å også undersøke i hvilken grad nettstedet dekker nyheter innenfor denne tematikken.

Validitet^

Kimberly Neuendorf trekker i The Content Analysis Guidebook frem flere krav til innholdsanalysens validitet42. For det første må det etableres intersubjektivitet, det vil si koderne må være enige om hva slags bedømmelser som er valide. For å kunne trekke valide slutninger fra tekstene som studeres, er det viktig at klassifikasjonsprosedyrene er reliable i den betydning at de er konsekvente – altså, ulike kodere bør kode samme tekst på samme måte. Klassifikasjonsprosedyren må også generere valide variabler. En variabel er valid i den grad den måler eller representerer det forskeren har ment den skal måle43. I vårt tilfelle vil det si at koderne må ha en felles forståelse for hvordan innholdet kodes. Det må ligge til grunn en felles oppfatning om hva som utgjør nyhetskategorier som politikk, kriminalitet og sosiale spørsmål, og hva som utgjør en artikkel eller en notis innenfor nyhetssjangeren.

Analysen har operert med en bred definisjon av nyhetsbegrepet og har inkludert her nyhetsinnhold utover den tradisjonelle harde nyhetssjangeren. Veiledende har nyheter vært ansett som ”det som står i avisen”, med unntak av tradisjonell bilagstematikk som hage, hjem, bil, horoskop, TV-guider osv44). Intersubjektivitet i dette prosjektet må kunne sies å være valid på et generelt nivå, ettersom de involverte koderne – hovedkoder og kontrollkoder – er utdannet i medievitenskap på masternivå og innen samme institusjon, og dermed deler denne oppfatningen av hva som utgjør en nyhet, og hvordan man definerer nyheter tematisk etter innhold. Det viste seg imidlertid at intersubjektiviteten i forhold til tematisk klassifisering av innhold var noe utilfredsstillende sett ut ifra kravet om interkoder-reliabilitet.

For at analysen skal være valid, må det også etableres reliabilitet for at analysen kan gjentas med samme forventede resultat45. Interkoder-reliabilitet er derfor et viktig element for innholdsanalysens validitet. Verktøy for utregning av interkoder-realiabilitet har tidligere vært lite tilgjengelige, og innen medievitskapen har det heller ikke vært særlig tradisjon for å rapportere reliabilitetstall. Interkoder-reliabilitet betyr at to kodere uavhengig av hverandre koder de samme enhetene likt (gir de samme verdi i kodeboken). Høy grad av uenighet mellom koderne kan indikere svakt metodedesign, svake definisjoner og kategorier, eller utilstrekkelig opplæring av koderne46. Vi bestemte oss for å teste interkoder-reliabilitet etter Cohens kappa (k), ettersom denne testen allerede er integrert i analysevertkøyet STATA.

Det er flere problemer med å bruke kappa for å stadfeste interkoder-reliabiltet. Kappa har blitt kritisert for å være et konservativt estimat. Cohen etablerte denne metoden først og fremst for å regne ut reliabiliteten i psykologiske studier, hvor fordelingen på tvers av variabler er mer forutsigbar enn i medievitenskaplige studier. Kappa passer også bedre til å regne ut enighet mellom kodere som har kodet ulike datasett, heller enn kontrollkoding på samme datasett, som vi har gjort her. Ettersom Cohen åpner for ulik vektig i kontrollkoden, og kappa passer best på nominelle verdier, gikk vi allikevel for denne reliabilitetstesten fremfor andre. Kappa er også en såpass konservativ test at verdier over .70 kan anses som akseptable i noen tilfeller47

Et gjennomgående problem i vår reliabilitetstesting har vært at variablene som måler innholdet på nrk.no inneholder opp til 8 undervariabler, mens mange av disse undervariablene sjelden registreres. Når de fleste registrerte variablene er like i reliabilitetstesten, blir det såpass liten varians i tabellene at kappa blir uforholdsmessig lav. Variablene er nemlig ikke designet for å registrere koding for hver enhet, men er tvert imot designet for å registrere ikke-koding. Designet registrerer ikke bare om en sak omhandler ulykker, men også at den i forlengelsen ikke omhandler økonomi, politikk, kriminalitet eller noen av de andre innholdsvariablene. Idet en artikkel kan sies å omhandle helse, vil dette registreres først som sosiale spørsmål i variabelen som registrerer hovedinnhold, deretter som helse under variabelen som registreres hva slags sosiale spørsmål det er snakk om. Alle andre innholdsvariabler vil i dette tilfellet registreres som 0, eller NA (ikke-gjeldende). Dette er nyttig for prosentutregning av innholdskategoriene, da 0-verdien defineres som ”missing” og dermed utelates i prosentutregningen.

Variabel Raw agreement Expected agreement Kappa Standard error Prob>Z
Prioritering 96% 35% .93 0.0749 0.0000
Hovedkategori 86% 59% .66 0.0872 0.0000
Innhold 81% 15% .77 0.0406 0.0000
Økonomi 92% 90% .17 0.0588 0.0013
Kriminalitet 89% 59% .72 0.0558 0.0000
Sosiale spørsmål 76% 59% .41 0.0651 0.0000
Politikk 84% 57% .62 0.0570 0.0000
Ulykker 99% 87% .92 0.0941 0.0000
Kultur og underholdning 74% 58% .37 0.0520 0.0000
Sport 98% 80% .90 0.0772 0.0000
Vær 100% 85% 1.00 0.1000 0.0000
Teknologi og vitenskap 100% 100% 1.00 0.1000 0.0000
Type stoff 95% 95% -.02 0.0845 0.5954
Oppfølging 88% 83% .28 0.0878 0.0007
Lenker 76% 49% .52 0.0794 0.0000

Tabell 2.3.1: Reliabilitetstest forsideanalysen, Cohens Kappa (k)

Vi regnet altså ut interkoder-reliabilitet – enigheten mellom to kodere – for analysen etter Cohens kappa. Reliabiliteten ble testet av hovedkoder og kontrollkoder. Forskerne i prosjektet var ikke kodere i denne testen. En kontrollkoder fikk i oppdrag å kode 100 enheter fra innholdsmaterialet og 100 enheter fra forsidematerialet. Begge kontrollutvalg ble tatt fra første dato i den konstruerte 10-dagersperioden. Kontrollkoding ble utført tidlig i prosessen – noe som ville gi tid til å korrigere kodeboken for større avvik. Dette viste seg også å være nødvendig, ettersom kontrollkodingen viste lav reliabilitet for innholdsanalysen. Kappa for forsideanalysen viste seg å være akseptabel i de fleste tilfeller (tabell 2.3.1). Lav kappa innen variablene økonomi, sosiale spørsmål, kultur, type stoff og oppfølging for forsideanalysen, skyldes liten varians – altså at nesten alle verdiene plasserer seg innen en og samme kategori og at resten av kategoriene står tomme. Likevel er det såpass god ”raw agreement” (prosentenighet) her at problemet med kappa oppheves.

Kappa for innholdsanalysen var ved første kontrollkoding for lav til å underbygge undersøkelsens validitet. Lav kappa kommer også her av en høy fordeling med liten varians, noe som igjen gjør at forventet enighet tilfeldigvis blir høy, som fører til lav kappa. Kappa er såpass lav på grunn av ekstrem fordeling, som for eksempel i variabelen ”Hovedkategori” (Innenriks/ Utenriks/ Norsk Utenriks) – hvor 88% av kodingene havner i samme kategori. Cohens kappa er kritisert for å gjøre for strenge anslag i slike tilfeller48. De fleste variablene her fikk en kappa under .70 – mange også under .50. Dette er regnet som for lave reliabilitetstall til å støtte undersøkelsens validitet. Dette uventet store avviket ble drøftet i gruppen. Da vi antok at grunnen lå i manglende opplæring av kontrollkoder, bestemte vi oss for å utføre en ny reliabilitetstest for innholdsanalysen, på nye 100 enheter. På grunn av strenge tids- og budsjettbegrensinger, ble det bestemt at kontrollkoding denne gangen skulle foretas av én av forskerne i prosjektet.

Variabel Kontrollkoding 1 Kontrollkoding 2 Kontrollkoding 3
KAPPA Agreement Kappa Agreement Kappa Agreement Kappa
Hovedkategori 93% .55 93% .86
Innhold 60% .51 67% .61 79% .75
Økonomi 87% .45 93% .82
Kriminalitet 77% .49 82% .60
Sosiale spørsmål 67% .41 70% .43
Politikk 80% .47 84% .56
Ulykker 85% .20 93% .62
Kultur og underholdning 84% .55 88% .62
Sport 94% .58 94% .55
Vær 94% .67 94% .67
Teknologi og vitenskap 94% .37 97% .49
Sjanger 80% .49 87% .66
Bred dekning 94% .22
Sted 86% .32

Tabell 2.3.2: Reliabilitetstester innholdsanalysen, Cohens kappa (k)

Andre reliabilitetstest viste enten akseptabel kappa eller akseptabel ”raw agreement” (prosentenighet) for alle variabler bortsett fra ”Innhold” (som registrerer hvilken av de 9 innholdskategoriene saken faller under) og ”Sosiale spørsmål”. Vi tok et nytt møte i gruppa hvor resultatene av reliabilitetstesten ble diskutert. Vi kom frem til at reliabilitet var oppnådd for analysen som helhet, men bestemte å se nærmere på de to variablene med lav reliabilitet. Ettersom reliabilitet ikke var oppnådd for ”Innhold” og ”Sosiale spørsmål”, ble det bestemt å foreta en ny reliabilitetstest mot slutten av prosjektet. Særlig viktig var det at variabelen ”Innhold” oppnådde reliabilitet, ettersom dette utgjør prosjektets hovedvariabel. Her ble 100 nye enheter kontrollkodet, denne gangen av to av forskerne i fellesskap. Da vi her fikk etablert at det foreligger en god felles forståelse av ”Innhold”-variabelen, fastslo vi at reliabilitet var oppnådd for alle variabler. Tabell 2.3.2 viser reliabilitetstestene for innholdsanalysen.

I denne gjennomgangen har vi redegjort for design, gjennomføring og validitetstesting av kvantitativ innholdsanalyse av forsideanalysen og innholdsanalysen av NRKs nyhetstilbud på nett i 2009. De metodiske utfordringene som har oppstått i gjennomføringen av denne analysen har demonstrert i hvilken grad måling av nettinnhold har måttet tilpasses både mediets egenart og innholdsprofilen til selve nyhetsprodusenten. En nødvendig justering av kodebok i forkant av, underveis i, og i etterkant av analysen har derfor vært med på å sikre validiteten i analysedesignet. Reliabilitetstesten avslørte problemer i forhold til koding av hovedinnholdet. Dette problemet har i størst grad vært knyttet til tolkningen av variabelen ”Sosiale spørsmål”. I den grad noen av variablene kunne sies å forutses som problematiske, stemmer dette overens med våre forventninger. Samtidig demonstrerer dette den tematiske bredden i nyhetstilbudet på nrk.no. Ved å kjøre flere samsvarende tester ble det allikevel oppnådd akseptabel reliabilitet for variablene i analysedesignet. Ved fremtidige gjentakelser av undersøkelsen vil det være naturlig å revurdere designet med henblikk på problemene oppdaget underveis i dette prosjektet.

Om case-studiene^

I det følgende redegjøres det for undersøkelsens to case-studier, av stortingsvalget i 2009 og Klimatoppmøtet i København. Case’ene behandler det vi har beskrevet som datasett (4).

Disse case’ene er underlagt ulike kvantitative og kvalitative deskriptive analyser. De er ikke fulle case-studier i streng forstand, i og med at vi ikke forsøker å forklare hvorfor dekningen ble slik vi beskriver49. Gitt undersøkelsens avgrensninger har vi for eksempel ikke gjennomført intervju med journalistene som dekket hendelsene. Heller er case-studiene konsentrert  om å beskrive og vurdere NRKs tilbud. I denne vurderingen sammenlignes imidlertid NRKs nettaktiviteter med andre aktører – henholdsvis TV2s nettilbud i dekningen av stortingsvalget og Aftenposten og VGs papirutgaver samt Dagsrevyen.

Studiene bruker altså komparasjon. Komparativ samfunnsforskning omfatter studier som eksplisitt sammenligner meningsfylte fenomen på tvers av historisk og geografisk definerte systemer50. Det er også vanlig å legge til at forskning benytter seg av enheter på samfunnsnivå for å forklare funnene i sammenligningen. Denne undersøkelsen benytter komparasjon i en mer begrenset betydning – for å kontekstuelisere NRKs virksomhet, og belyse særtrekk og likheter med andre medieaktører. Tilnærmingen er case-orientert eller intensiv. Det innebærer et ønske om å tolke felles historiske prosesser i en håndfull case’er. Startpunktet er altså interessen for noen spesifikke, historiske prosesser og strukturer. Her følger en redegjørelse for metodiske valg og vurderinger som er gjort i arbeidet med case-studiene, inkludert de komparative dimensjonene.

Analysen av dekningen av stortingsvalget^

Sammenligningen av NRK og TV2s dekning av stortingsvalget på nett bygger prosjektet på tekstanalytiske metoder utviklet innen medievitenskapen og dens nabodisipliner. Disse er mobilisert og tilpasses studiet av medieinnhold på nettet – karakterisert av blandinger mellom ulike medieformer. Mens den kvantitative analysen i hovedsak tar utgangspunkt i individuelle tekstbaserte nyhetssaker, behandler den kvalitative analysen av dekningen av stortingsvalget større deler av nettstedet nrk.no og NRK-innhold på eksterne nettsteder i sammenheng. Slik synliggjøres det hvordan ulike enkeltdeler av NRKs nyhetstilbud kobles sammen til å utgjøre et hele, og hvordan nrk.no inngår i sammenhenger med andre nettsteder og andre aktører på nettet.

Analysen fokuserer på integreringen av ulike former for nettjenester i nyhetsformidlingen som legger til rette for deltagelse. Nyhetslesing på nett karakteriseres av at brukerne setter av en viss porsjon tid til å bli informert om nyheter, og krever uttelling for den tiden. Dette stiller krav til at stoffet skal være både engasjerende, forståelig, meningsfullt og ikke minst oversiktlig51. Nettjournalistikken har store potensialer for å utnytte en i teorien uendelig publiseringsplass, i motsetning til kringkastet radio og tv sine begrensede tidsskjema. Nettpublisering åpner for større dybde, flere perspektiver, hyppig oppdatering av nyheter, og kan gi brukerne større muligheter til å bidra i debatter. Forskning har vist at skandinavisk nettjournalistikk kun delvis har utnyttet fordelene med nettpublisering52. Lignende ”forsiktighet” i tilnærmingen er også funnet i studier fra andre deler av verden53. Allmennkringkastingsinstitusjoner trekkes gjerne fram som eksempler på tilbydere som i liten grad har omfavnet nye modeller for journalistikk på nettet, men som likevel nyter stor suksess blant brukerne54. Det er lite som tyder på at fordelene ved nyhetsdekning på nett står i motsetning til nevnte krav om uttellende nyhetslesing.

Brukermedvirkning, deltagelse og interaktivitet er begrep som fikk et oppsving både blant praktikere og forskere i kjølvannet av Internetts framvekst. En kan skille mellom ulike former for, og grader av, brukermedvirkning, for eksempel med termene overføring, registrering, konsultasjon og samtale55. Her vil overføring innebære at distribusjon er kontrollert av produsenten, som også er tilbyder av innholdet. Dette er medieformer uten direkte brukermedvirkning, som en gjerne finner innen tradisjonelt kringkastet radio eller tv. Kontrasten er samtalen, som vi kjenner fra direkte toveis kommunikasjon, for eksempel gjennom telefon eller Internettbaserte applikasjoner for dialog mellom to eller flere brukere. Konsultasjon og representerer altså mellomformer. Mens registrering handler om at tilbyder samler eller loggfører informasjon om brukerne, er konsultasjon og er den typen eller graden av brukermedvirkning vi oftest finner i diskusjoner om Internett: Det kan dreie seg om at brukeren aktivt søker fram og velger innhold som gjennom video-on-demand eller på web’en. I praksis vil det selvsagt være snakk om blandinger av slike former for interaktivitet, for eksempel når en bruker av NRKs nyhetstilbud på nett søker opp nettstedet nrk.no, velger å lese en nyhetssak produsert av NRK, og deretter leser og skriver inn en kommentar til denne artikkelen, eller fortsetter debatten om temaet i NRKs diskusjonsfora. Denne bruken inkorporerer alle formene for interaksjon: Brukeren konsulterer nrk.no og den konkrete nyhetssaken, som overføres av NRK mens bruken registreres, før brukeren inngår i en samtale med andre brukere.

En nyere modell utviklet spesifikt for nettaviser skiller mellom bruker-interaktivitet, bruker-medium-interaktivitet, medium-interaktivitet og medium-bruker-interaktivitet56. Bruker-interaktivitet er kommunikasjon mellom brukere eller mellom brukere og journalister. Tjenestene som brukes er typisk chat, diskusjonsfora, muligheter til å ”tipse” en venn om en sak via epost etc. Bruker-medium-interaktivitet handler om at brukere bidrar med innhold i form av tips, egne leserblogger, mulighet for å presentere egne bilder etc. Medium-interaktivitet innebærer at brukeren kan styre opplevelsen av innhold gjennom bruk på ulike plattformer, ulike versjoner eller på ulike tidspunkt. Medium-bruker-interaktivitet dreier seg om å ”skreddersy” eller brukertilpasse innhold, for eksempel gjennom bruk av RSS, epostvarsel og lignende.

Det er en utbredt og gammel ide at brukermedvirkning i mediene kan virke demokratiserende ved å justere maktforholdet mellom publikum og profesjonelle medieprodusenter, og slippe flere, og mer ulike stemmer til i offentligheten. En slik idé er ikke dukket opp med Internett og digitale medier, men har fått en forsterket kraft de siste 15 årene57. Med utgangspunkt i konkrete studier av brukernes opplevelse av ulik deltagelsesformater på tv og Internett har også forskere argumentert for at slike tjenester er stimulerende for brukernes kompetanse, deltakelse og tilgang på nett58. En rekke studier har også tatt for seg i hvilken grad slik initiativ basert på brukermedvirkning utnytter potensialet som ligger utvikling av former og genre på nye medieplattformer som Internett59. Når det gjelder kringkastingsinstitusjoners inntreden på Internett har forskere også vist at denne har vært preget av en forlengelse av publikumsforståelsen fra tv – heller enn en forestilling om brukerne som mer aktive og deltagende60.

Det er heller ikke gitt verken at medieaktørenes motivasjoner for å stimulere til deltagelse samsvarer med ideen om demokratiserende effekt, eller at resultatet av økt brukermedvirkning i mediene faktisk fører til et mer balansert forhold mellom publikum og produsentene og slipper til flere ulike stemmer i offentlig debatt61.

I denne undersøkelsen kan brukermedvirkning og –deltagelse knyttes til spesifikke forpliktelser uttrykt i NRKs vedtekter. Det er imidlertid ikke nødvendig med en evaluering av den faktiske bruken av ulike tjenester for å vurdere NRKs virksomhet på nett knyttet til brukerdeltagelse: Vedtektene slår nemlig fast at NRKs Internettilbud skal inkludere tilbud av ”tjenester og spill som stimulerer til interaktiv deltakelse” (§17a). Dette må forstås å gjelde også for nyhetstilbudet, som også Medietilsynet understreker sin tilbudsinvitasjon for denne undersøkelsen.

Analysen av dekningen av klimatoppmøtet i København^

Studien av dekningen av klimatoppmøtet er en deskriptiv case-studie, som karakteriserer profilen på dekningen. Case-studien har to deler.

Den første delen er ikke komparativ, og dreier seg om praksisen med ekstern lenking i sakene på nrk.no og referanser fra Dagsrevyen til nrk.no. Som eksterne lenker har vi regnet alle lenker til andre domener enn nrk.no. Vi har ikke foretatt videre analyser av den informasjonen det lenkes til, men regnet alt som å bidra til utdyping av stoffet på nrk.no. I studien av referansene fra Dagsrevyen har vi sett gjennom alle innslag i den aktuelle perioden (1.-22. Desember 2009), og vurdert sammenhengen mellom tv-saken det lenkes fra og saken på nrk.no. Vi har gjort dette uten å sammenlikne den detaljerte analysen av stemmer, sjanger eller globalt perspektiv i de to sakene, som ikke var nødvendig for å vurdere om det var tematiske sammenhenger mellom de to sakene.

Den andre delen av case-studien er komparativ, og sammenlikner innholdet i dekningen av klimatoppmøtet på nrk.no med dekningen i papirutgavene av Aftenposten, VG og Dagsrevyen. Analysen av innholdet i dekningene er gjort med utgangspunkt i et kodeskjema utviklet av det internasjonale forskernettverket Media Climate Project. I dette prosjektet sammenliknes mediedekningen av klimatoppmøtene på Bali og København i 18 land, med representanter fra alle verdensdeler. Vi har kodet dekningen av møtet i København etter det samme skjema, og i den samme perioden som dem: fra 1. til 22. desember 2009. Den norske delen av Media Climate Project har fra før kodet dekningen i Aftenposten, VG og Dagsrevyen, og vi har fått tilgang til disse dataene for å gjøre en sammenlikning med dekningen på nrk.no62.

Komparasjonen er relevant på bakgrunn av kravet om at nrk.no skal bidra med dybde og perspektiv til nyhetsbildet i Norge. Valget av disse mediene for sammenlikning er selvsagt også styrt av at kodingen av disse var tilgjengelige for oss gjennom Media Climate-prosjektet63. Data som allerede foreligger gir altså muligheten for sammenligning mellom dekningen på papir og nett. Vi vurderte også å sammenlikne dekningen på nrk.no med den samme på tv2.no og svt.se. Dette ville også vært relevant, men vi gikk bort fra dette av flere grunner. Den viktigste er at det ville være svært vanskelig innenfor tidsrammen å sikre oss at vi hadde fått tak i alt som var publisert på de to nettstedene om toppmøtet, og dermed skapt grunnlag for en rettferdig sammenlikning.

Kodeskjemaet fra Media Climate-prosjektet har i noen tilfeller en mer finmasket inndeling enn det som kommer frem i vår analyse i del 6.5. Mens vår koding av NRKs dekning på nettet er basert på inndelingene til Media Climate, har vi samlet en del inndelinger under større kategorier på grunn av at det har vært mer formålstjenlig i vår analyse. Som figur 2.4.1 viser hadde for eksempel nrk.no nesten ikke kommentarstoff i forbindelse med dekningen av klimatoppmøtet. I kodeskjemaet er kommentarstoff inndelt i sjangrene leder, kommentar/nyhetsanalyse gjort av journalist ansatt i redaksjonen, kommentar/nyhetsanalyse gjort av ekstern journalist/kommentator, leserbrev, og annet kommentarstoff. Fordi disse undersjangrene har liten relevans i vår analyse, er de slått sammen under samlebetegnelsen ”kommentarstoff”.

MetodeMetodeMetodeFigur 2.4.1 viser nrk.no sammenliknet med papirutgaven av VG og Aftenposten. Merk at NRK på nett har betraktelig mindre kommentarstoff enn de øvrige. Figuren er å finne igjen i analysen som figur 5.5.5.

I kodingen av stemmer var det også flere underkategorier som ikke kommer frem i analysen fordi de er samlet i større kategorier: Internasjonalt politisk system har underkategoriene: regionale organisasjoner (for eksempel EU), FN og dets underorganisasjoner, IPCC, og annet. NGOer64 og enkeltindivider er inndelt i NGO innland, NGO utland, aktører på grasrotnivå/enkeltindivider innland, aktører på grasrotnivå/enkeltindivider utland, og andre. Næringsliv er inndelt etter innland/utland, og annet. Vitenskapsfolk er først inndelt etter innland/utland, og så inndelt etter felt: teknologi, naturvitenskap, samfunnsvitenskap/humaniora, økonomi, og annet.

Vi har også lagt til enkelte kategorier som ikke er med i Media Climate-prosjektets kodeskjema: Vi har kodet kjønnsfordelingen for hovedstemmene i dekningen til nrk.no og Dagsrevyen. Interaktive element er også lagt til i kodingen av nrk.nos dekning.65 I tillegg har vi undersøkt om sakene er programrelatert, det vil si om det er en forbindelse mellom sakene på nrk.no og NRKs programtilbud i radio eller tv. Dette har vi bare funnet i forbindelse med 6 satiresaker i serien ”Ja til et varmere Norge”66, som vi har valgt å ekskludere fra analysen, samt i et par saker fra Lydverket, som også er ekskludert fra utvalget, fordi klimatoppmøtet bare ble nevnt, og sakene dreide seg om noe annet enn klimatoppmøtet. Vi har ikke gått gjennom videoene i sakene og undersøkt om disse har en kobling til programtilbudet. Som nevnt ovenfor har vi også sett på eksterne lenker i sakene på nrk.no, i tillegg til henvisninger til nrk.no i Dagsrevyens sendinger.

I tillegg har vi lagt mindre vekt på enkelte kategorier i kodeskjemaet. Media Climate-prosjektet ønsker blant annet å undersøke de måtene klimaspørsmål generelt blir behandlet på i journalistikken. De har derfor sett på alle saker om klimaendring i perioden og kodet hvilken relevans sakene hadde, det vil si om sakene dreide seg om 1) klimatoppmøtet i København, om 2) klimaendringer (men ikke om COP15), eller om 3) noe annet enn klimatoppmøtet/klimaendring og klimatoppmøtet i København bare var nevnt. Vi har ikke hatt som mål å undersøke behandlingen av klimaspørsmål generelt i nyhetsdekningen til nrk.no, og har derfor heller ikke lagt stor vekt på relevans i vår analyse, selv om vi har registrert sakenes relevans i kodingen. Kodingen av nrk.nos nyhetsdekning vil ikke være direkte sammenlignbar med de andre mediene på dette punktet, fordi alt materiale vi har analysert ut over ting fra nrk.no/nyheter/klima har hatt direkte relevans til klimatoppmøtet som et utvelgingskriterium.

For sakene som ligger under ”nrk.no/nyheter/klima” har vi kodet alle saker som faller inn under de tre kategoriene nevnt over. Men når det gjelder artikler vi har hentet inn fra andre områder (”Verden”, ”Norge”, ”Siste nytt”, ”Distrikt” og ”yr.no”) har vi kun tatt med saker som handler om/er satt i forbindelse med klimatoppmøtet.

NRK har ikke en konsekvent praksis når det gjelder å tagge saker fra nyhetsbyrå. Noen ganger merkes saken med (NTB) eller lignende, andre ganger kan det se ut som NRK selv har produsert saken, selv om den er hentet fra et nyhetsbyrå eller en annen medieaktør. Dette kan dermed være en feilkilde i vår koding, selv om vi har sett etter tegn på at sakene kan være produsert av nyhetsbyrå. I kodingen kan vi derfor i enkelte tilfeller ha vært sjenerøse, og kodet saker som ikke er produsert av NRK som egenprodusert stoff.

Fotnoter^

  1. I følge Statistisk sentralbyrå hadde 88% i Norge tilgang til personlig datamaskin i 2009. 86% hadde tilgang til internett hjemme, 78% via bredbånd (SSB, IKT i husholdningene, 2. kvartal 2009. http://www.ssb.no/ikthus/  (tilgjengelig 25.03.10). []
  2. Eide, Martin (1992) Nyhetens interesse: Nyhetsjournalistikk mellom tekst og kontekst, Oslo: Universitetsforlaget, s. 31 []
  3. Eide, Martin (1992) Nyhetens interesse: Nyhetsjournalistikk mellom tekst og kontekst, Oslo: Universitetsforlaget,, s. 30 []
  4. Waldahl, Ragnar, Andersen, Michael Bruun og Rønning, Helge (2002) Nyheter først og fremst: Norske tv-nyheter: myter og realiteter, Oslo: Universitetsforlaget, s. 16-17 []
  5. Ellis, John (2000) Seeing Things: Television in the Age of Uncertainty, London: Tauris, s 75ff []
  6. Silverstone, Roger (1994) Television and Everyday Life, London: Routledge. []
  7. Waldahl, Ragnar, Andersen, Michael Bruun og Rønning, Helge (2002) Nyheter først og fremst: Norske tv-nyheter: myter og realiteter, Oslo: Universitetsforlaget, s. 14, 19-22 []
  8. Allern, Sigurd (2001) Nyhetsverdier: Om markedsorientering og journalistikk i ti norske aviser, Oslo: IJ Forlagets, s. 46; Eide, Martin (1992) Nyhetens interesse: Nyhetsjournalistikk mellom tekst og kontekst, Oslo: Universitetsforlaget,, s. 48; Waldahl, Ragnar, Andersen, Michael Bruun og Rønning, Helge (2002) Nyheter først og fremst: Norske tv-nyheter: myter og realiteter, Oslo: Universitetsforlaget, s. 15 []
  9. Eide, Martin (1992) Nyhetens interesse: Nyhetsjournalistikk mellom tekst og kontekst, Oslo: Universitetsforlaget,, s. 27, 106 []
  10. Diskusjonen bygger på Hallvard Moe (2009) “Sentrale utfordringer for medieforskningen i dag.” Norsk Medietidsskrift 16(3): 284-292. []
  11. For videre diskusjon se Niels Brügger (2008): ”The Archived Website and Website Philology – A New Type of Historical Document?” i Nordicom Review årg. 29(2):155-75 og Steven M. Schneider og Kirsten A. Foot (2004) “The Web as an Object of Study.” New Media & Society 6(1): 114-22. []
  12. Private arkivtjenester som Internet Archive (http://www.archive.org/) er i beste fall ufullstendige og ustabile. For denne undersøkelsens del var det, grunnet Internet Archives metode for arkivering, per mars 2010 ingen tilgjengelige versjoner av nrk.no fra 2009. []
  13. Se Niels Brügger (2009) ”Registrant for dr.dk 1996-2006”, http://drdk.dk/wiki/index.php/Registrant_for_dr.dk_1996-2006 (tilgjengelig 25.03.10). []
  14. Niels Brügger (2009) “Website History and the Website as an Object of Study.” New Media & Society 11(1-2): 115-132. []
  15. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s. 126 []
  16. For en fullstendig liste, se kodeskjema, vedlegg 3. []
  17. Se http://www.gnu.org/software/wget/manual/ for detaljer. []
  18. Vi beholdt den URLen som er høyest rangert i SQL, som for tekst er alfabetisk. Dette kan anses som problematisk, men da antall duplikater var såpass lavt i forhold til det totale antallet anser vi det som akseptabelt. []
  19. Listene vi fikk ettersendt fra NRK inneholdt enkelte saker som ikke fantes i indexen vi fikk i første omgang, også ut over økonomisaker. []
  20. Et artikkelelement er et i denne sammenhengen et strukturelt element i HTML-koden websidene består av. Et typisk eksempel er en div-tag med klassen ”arctile”.  <div class=”article”>… []
  21. Se http://www.python.org/ for detaljer og kode. []
  22. Se http://www.crummy.com/software/BeautifulSoup/ for detaljer og kode. []
  23. Eksempel på cite-tag som krediterer en NTB-sak: <cite>(NTB)</cite> []
  24. Cédrick Fairon og Hubert Naets (2007) Building and Exploring Web Corpora. Presses univ. de Louvain. []
  25. .csv impliserer kommaseparerte verdier. .csv-ekstensjonen brukes ofte også for ulike delimiterseparerte formater, som tabularot, semikolon, osv. Vi brukte tabulator. []
  26. Krippendorff, Klaus (1980) Content Analysis: An Introduction to its Metholdology, s 21, og Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s.10. []
  27. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s.52 []
  28. Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s.48 []
  29. Følgende 10 datoer ble valgt ut på forhånd: mandag 19 januar; onsdag 11 februar; torsdag 12 mars; fredag 24 april; søndag 21 juni; tirsdag 18 august; onsdag 16 september; torsdag 15 oktober; fredag 13 november; lørdag 5 desember. []
  30. Slike sammenligninger er kun foretatt i begrenset omfang i denne rapporten. Selv om analysedesignet her er basert på tidligere studier av nyhetsinnhold på fjernsyn, er det begrenset hvor tilstrekkelige slike sammenligninger mellom ulike medieformer kan bli. Tidsbegrensninger har dessuten gjort at vi har valgt å fokusere på fremstilling og analyse av resultatene for denne analysen, samt å sammenligne forsideanalysen med innholdet som helhet, heller enn å bruke mye tid på å tilpasse studien for sammenligning med andre, tidligere studier av nyhetsinnhold. []
  31. 3 av dagene i utvalget omfatter forsidebilder fra 06:00-20:00 – mandag 19 januar 2009, onsdag 11 februar 2009 og torsdag 12 mars 2009. Dette fordi vi på grunn av tidspress først bestemte å begrense undersøkelsens omfang etter at disse datoene allerede var kodet. []
  32. Se for eksempel http://www.nrk.no/programmer/radio/andakten/1.6580870, og http://www.nrk.no/informasjon/organisasjonen/1.6579367, (tilgjengelig 22.04.10) []
  33. Weber, Robert Philip (1990) Basic Content Analysis, Second Edition, Sage University Paper: Newbury Park, s. 13 []
  34. Se for eksempel Allern, Sigurd (2001) Nyhetsverdier: Om markedsorientering og journalistikk i ti norske aviser, Oslo: IJ Forlaget. []
  35. Waldahl, Ragnar, Andersen, Michael Bruun og Rønning, Helge (2002) Nyheter først og fremst: Norske tv-nyheter: myter og realiteter, Oslo: Universitetsforlaget, og Waldahl, Ragnar, Andersen, Michael Bruun og Rønning, Helge (2009) TV-nyhetenes verden, Oslo: Universitetsforlaget. []
  36. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s. 103-105 []
  37. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s. 74 []
  38. Variabler vi fjernet inkluderer hvem som utgjorde kildene i nyhetssakene og hvorvidt saken var basert på pressemelding eller ikke. Disse variablene ble fjernet først og fremst fordi de var for tidkrevende for prosjektets begrensede tidsramme. []
  39. Allern, Sigurd (2001) Nyhetsverdier: Om markedsorientering og journalistikk i ti norske aviser, Oslo: IJ Forlaget, s. 78 []
  40. Slik sekundærvinkling er ikke rapportert i denne analysen da det i ettertid ikke har vært ansett som relevant for å svare på problemstillingene. []
  41. Mange saker som omhandlet politiet og som ikke hadde en administrativ vinkling ble kodet som ”Annet” under ”Sosiale spørsmål”. En større sak i materialet omhandlet en brukerundersøkelse av tillitt til politiet. Se for eksempel ”Åtte av ti nordmenn har tillitt til politiet” http://www.nrk.no/nyheter/1.6439469, tilgjengelig 20.04.10 []
  42. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks, s 10ff []
  43. Weber, Robert Philip (1990) Basic Content Analysis, Second Edition, Sage University Paper: Newbury Park, s. 12 []
  44. Harcup (2004 []
  45. Neuendorf, Kimberly A. (2002) The Content Analysis Guide Book, Sage: Thousand Oaks []
  46. Lombard, Matthew; Snyder-Duch, Jennifer & Bracken, Cheryl Campanella (2002) ”Content Analysis in Mass Communication: Assessment and Recording of Intercoder Reliability”, Human Communication Research, 28:4, pp 587-604, s. 588-589 []
  47. Verdier på 1.00 regnes som perfekte, verdier over .90 som gode, over .80 som akseptable og verdier over .70 som akseptable in noen tilfeller. Se Lombard, Matthew; Snyder-Duch, Jennifer & Bracken, Cheryl Campanella (2002) ”Content Analysis in Mass Communication: Assessment and Recording of Intercoder Reliability”, Human Communication Research, 28:4, pp 587-604, s. 592, 600. []
  48. Lombard, Matthew; Snyder-Duch, Jennifer & Bracken, Cheryl Campanella (2002) ”Content Analysis in Mass Communication: Assessment and Recording of Intercoder Reliability”, Human Communication Research, 28:4, pp 587-604, s. 600 []
  49. Sammenlikn standard krav til design av case studier: Robert K. Yin (2009) Case Study Research. London: Sage. []
  50. Se Hallvard Moe (2005) ”Komparativ samfunnsforskning – om kunnskapsinteresser og holdninger til teori”, Universitetet i Bergen. []
  51. Martin Engebretsen (2000) Nettavisen og brukerne. En panelstudie med fokus på nettavislesernes vaner, preferanser og medieforståelse, Kristiansand: IJ-forlaget. []
  52. Martin Engebretsen (2006) “Shallow and Static or Deep and Dynamic? Studying the State of Online Journalism in Scandinavia.” Nordicom Review 27(1): 3-16. Se også Anders Larsson (2009) “Interactive Features on Newspaper Web Sites – Two Research Projects.” Upublisert paper. []
  53. Se for eksempel Deborah S. Chung (2007) “Profits and Perils: Online News Producers’ Perceptions of Interactivity and Uses of Interactive Features.” Convergence: The International Journal of Research into New Media Technologies 13(1): 43-61. []
  54. Se for eksempel Axel Bruns (2005) Gatewatching: Collaborative Online News Production. New York: Peter Lang. []
  55. Se Jan L. Bordewijk og Ben van Kaam (1986) “Towards a new classification of TeleInformation Services.” Inter Media 14(1). For videre diskusjon, se for eksempel Jens F. Jensen (1999) “The Concept of ‘Interactivity’” i J. F. Jensen and C. Toscan (red.) Interactive Television. TV of the Future or the Future of TV? Aalborg: Aalborg University Press. []
  56. Deborah S. Chung (2008) “Interactive Features of Online Newspapers: Identifying Patterns and Predicting Use of Engaged Readers.” Journal of Computer-Mediated Communication 13(3): 658-679. []
  57. Et eksempel på tidlig uttrykk for ideen om den demokratiserende verdien av mediedeltagelse er Bertholt Brechts visjon om radioen som “the finest possible communication apparatus in public life […] if it knew how to receive as well as to transmit” (sitert i Marc Silberman (2000) Brecht on Film and Radio. London: Methuen, s. 42). Eksempel på en nyere studie knyttet til deltagelse i tv er Brian McNair et al. (2003) Mediated Access: Broadcasting and Democratic Participation. Luton: University of Luton Press. Et eksempel direkte knyttet til internett er Andrew Feenberg (2008) “Et demokratisk Internett?” i B. Gentikow og E. G. Skogseth (red.) Medier og demokrati. Oslo: Spartacus. []
  58. Se for eksempel Nico Carpentier (2003) “The BBC’s Video Nation as a Participatory Media Practice.” International Journal of Cultural Studies 6(4): 425-47. []
  59. Se for eksempel Gunn Enli (2007) The Participatory Turn in Broadcast Television. Institutional, editorial and textual challenges and strategies. Oslo: Universitetet i Oslo, og Myra Macdonald (2007) “Television Debate, ‘Interactivity’ and Public Opinion: The Case of the BBC’s ‘Asylum Day'”. Media, Culture & Society 29(4): 679-89. []
  60. Se for eksempel Eugenia Siapera (2004) “From Couch Potatoes to Cybernauts? The Expanding Notion of the audience on TV Channels’ Websites.” New Media & Society 6(2): 155-172. []
  61. For to norske studier, se Arnt Maasø et al. (2007) ”’Fordi de fortjener det’. Publikumsdeltakelse som strategisk utviklingsområdet i mediebransjen”. Norsk Medietidsskrift 14(2): 126-154, og Faltin Karlsen et al. (2009) “Non-professional Activity on Television in a Time of Digitalisation. More Fun for the Elite or New Possibilities for Ordinary People?” Nordicom Review 30(1): 19-36. []
  62. Resultatene fra analysen av dekningen på nrk.no vil til gjengjeld bli gjort tilgjengelig for Media Climate-prosjektet. []
  63. Dette er et internasjonalt forskningsprosjekt, der Elisabeth Eide har ansvar for det norske arbeidet. Prosjektet hadde oppstart ved årsskiftet 2008/2009. Det er blant annet støttet av Fritt Ord, Meltzerfondet, Culcom/UiO, HiO og Tampere Universitet. Mer informasjon: http://mediaclimate.blogspot.com/2009/08/media-climate-project-description.html (tilgjengelig 16.04.10). []
  64. NGO – non-governmental organization. []
  65. I de aller fleste tilfeller vil interaktive element i vår koding være videoer: ”del”-funksjon og kommentarfelt er ikke kodet. []
  66. Se http://www.nrk.no/programmer/tv/schrodingers_katt/1.6909624 (tilgjengelig 15.04.10). []