http.tv4.se

http.tv4.se

En Rapport om Twitter – men var är Nyheterna?

Hampus Brynolf på konsultföretaget Intellecta presenterade i morse en rapport om Twitter i Sverige (PDF) som fick stort genomslag bland svenska twittrare. Som alltid när en siffra på antalet användare utlovas blir intresset stort, och som alltid hamnar man i svårigheter kring dels definitioner och dels mätmetoder.

Definitionerna handlar även i detta fall om begreppen “svenska” och “aktiva”. Rapportens undertitel är “En rapport om Twitter i Sverige” men redan i första stycket i metodavsnittet (s. 1) avfärdas möjligheten att geografiskt bestämma användare och man förespråkar istället en indelning efter språk. Därmed utesluts de i Sverige som twittrar på andra språk (det finns antagligen en hel del som uteslutande twittrar på engelska) och man får även in de utanför Sverige som twittrar på svenska (t.ex. användare på Åland och de svensktalande delarna av Finland). Man kan fråga sig om man inte borde ha tagit med de som angivit svenska platser som en kontrollgrupp för att få möjlighet att se hur många av dessa som man fångat upp genom sin språkidentifiering.

Man nämner inte hur man seedade insamlingen av data (andra stycket under metod, s. 1), dvs. vilka personer man började insamlingen ifrån. Är påståendet om att det bara finns ett sammankopplat kluster (som görs nederst på sidan 2) korrekt spelar det ingen roll hur seedningen gjordes eftersom man ändå skulle nå alla som twittrar på svenska. Problemet är att det inte alls är otroligt att “hermetiskt slutna system” skulle uppstå. Backstrom, Huttenlocher et al 2006 t.ex. nämner som ett exempel att “disconnected components” kan uppstå i sociala nätverk där rekryteringen inte främst sker genom att vänner bjuder in vänner utan där beslutet att gå med inte främst påverkas av vilka vänner som redan är med. Har man haft en liten seedning skulle man inte upptäcka sådana okopplade kluster.

Definitionen av aktiv sätts här (stycke 2, s. 3) som att ha skrivit tre eller fler tweets och att ha skrivit minst en tweet de senaste 30 dagarna. Eftersom man inte givit referenser till de “mer eller mindre omfattande och seriösa försök” (s. 1) som gjorts de senaste åren går det inte heller att ställa definitionen av aktiv i förhållande till siffran över aktiva twittrare som ges. Valet av just dessa gränser motiveras hur som helst inte. I ett senare skede (s. 9) talar man om att en person kan “ha en normal twitterfrekvens där de bara uppdaterar varannan månad” men det är inget man diskuterar i samband med den valda gränsen.

Ett genomgående problem med texten är att man likställer person med konto. Genomgående används ordet person när man drar slutsatser om data från konton. Att en person kan ha olika konton eller ett företagskonto kan ha flera skribenter nämns inte.

I analysdelen nämns att genomslaget för Twitter-meddelanden i svenska medier ökat. “Antalet omnämnanden av twitter[sic!] i mediearkivet[sic!] är ständigt ökande, men antalet aktiva twittrare verkar inte öka nämnvärt.” (s. 10) Någon siffra på hur antalet omnämnanden varierat över tid ges dock inte. Man hävdar att “ju färre som använder tjänsten, desto större blir det relativa inflytandet för varje aktiv twittrare”. För att komma med ett sådant påstående behöver man ha tittat på vilka som omnämns i samband med detta. Det skulle ju kunna vara så att man gått från att nämna flera twittrare i medierna men till slut bara citerar Carl Bildts tweets, och i såfall har ju det relativa inflytandet för varje aktiv twittrare utom Carl Bildt faktiskt minskat (medan det varit oförändrat på noll för de flesta).

I analysen tas aktiviteten hos twittrarna upp. Att tio procent står för åttio procent av antalet tweets kanske är korrekt men denna siffras användbarhet är ganska begränsad. En mer intressant fråga är hur många procent som står för åttio procent av antalet lästa tweets. En fråga som dock är betydligt svårare att få besvarad.

Det jag anser vara det största problemet med denna analys är att den alldeles för lättvindligt bortser från faktorer som man valt att inte undersöka samt att man ger en siffra på antalet aktiva twittrare med fem värdesiffror utan några osäkerhetsmarginaler. Man redogör inte heller någon karakteristik hos den närmare en miljon twitterkonton man studerat men inte bedömt vara på svenska. Vilka språk är de på? Hur många svenska konton följer dessa? Vad har de angett som geografisk position? Nu är det ju av upphovsrättsskäl svårt att dela med sig av all insamlad data men man skulle åtminstone kunna erbjuda en datamängd bestående av vilka konton som undersökts, hur de hänger ihop samt vilken av metoderna för språkanalys som använts för var och ett.

Bilderna från presentationen verkar innehålla en konstighet som inte finns med i rapporten. Enligt tidsaxeln i detta diagram har folk börjat twittra redan innan Twitterskaparna ens börjat jobba med Odeo.
Twittercensus live

Vi väntar fortfarande på en “korrekt och med verkligheten överensstämmande mätning” av Twitter i Sverige. Ja, jag tittar på er, högskolesverige.

No related posts.

blog comments powered by Disqus