Under construction: Visex

9.58: Jag (David) har kopplat in datorn, tagit en kopp te och ska sätta igång med mitt projekt. Jag har sedan tidigare laddat ner en drös videoklipp (en från varje dag under 2013 hittills) och sparat cirka 30 sekunder av dem. Jag har installerat bildanalysbiblioteket OpenCV och har provkört lite att identifiera ansikten i stillbilder.

Det går att koppla OpenCV till mitt standardspråk Ruby med hjälp av FFI och lite C-programmering men det blir nog enklare att utnyttja Python-API:t.

10.23: Att visa innehållet från webbkameran i ett fönster är lite av ett stickspår men det fungerar i alla fall. Nästa steg blir att lägga in ansiktsigenkänningen som jag redan utnyttjat på stillbilder och sedan byta ut indatat från webbkameran till att läsa från fil.

11.02: Fortsätter med klipp-och-klistrandet med kod, nu för att markera ansikten med blå rektanglar.

11.24: För att få lite bättre ordning på filerna skapade jag ett nytt repository i git med tillhörande repository på Github. Just nu: 1 Python-fil, 2 Ruby-filer och 1 XML-fil.

13.41: Lunchen är avklarad och jag har dessutom laddat upp en snutt med någon sekunds videomaterial för varje dag sedan årsskiftet.


Urvalet har varit Nyheterna, Nyhetsmorgon och Jenny Strömstedt. Mycket Mitt kök blir det. En del (tragi-)komiska effekter blir det när personer fyller i varandras meningar.

“Hallongrädde emellan och stora kräftor”

Nu ska jag fortsätta med att märka ut ansikten i videomaterialet.

14.31: Nu läser koden in en videofil och markerar ansiktena (plus annat som den tror är ansikten) samt skriver ut till fil. Det går dock långsammare än realtid men det borde gå att snabba upp genom att inte processa varenda frame.

16.54: Efter ett avbrott för tårta så fortsatte jag med skapandet av bilder med ansikten.

2013-10-16 16.23.28

Skriptet klipper ut varje ansikte i varje frame till en ny bild. I klippet på 60 sekunder (1500 frames) fick jag ut 1580 ansiktsbilder. Som man kan se i exemplet nedan så är inte alla ansikten, någon tallrik eller hylla blev misstagen för ett ansikte ibland.

Nästa steg blir att minimera dessa nästan 1600 bilder till ett fåtal så att man inte får så många liknande bilder.

17.28: Kommer fram till att det enklaste sättet att minska antalet ansiktskandidater urklippta är att kasta bort de som är alldeles för små. Kollar jag att en utskuren kandidat är minst 96 pixlar så minskar antalet bilder från 1580 till 435 varav 5 ser ut att vara delbilder som inte är ansikten.

(Uppdateras under dagen)

Läs om vår kommentarspolicy