Computermodel voorspelde Time’s ‘Person of the Year’ – maar zat er flink naast

Woensdag 11 december maakte het Amerikaanse Time Magazine bekend wie de ‘Person of the year 2013’ is geworden: Paus Franciscus. Een internationale groep taaltechnologen afkomstig van de Universiteit Antwerpen, de Radboud Universiteit Nijmegen, het Meertens Instituut en de University of Illinois heeft een computermodel gebouwd waarmee zij de uitkomst voor 2013 hebben voorspeld. Maar in die voorspelling stond de Paus niet eens in de top-10…

Al sinds 1927 verkiest Time Magazine jaarlijks een ‘Person of the Year’. Het Amerikaanse blad vestigt zo de aandacht op een figuur die een belangrijke positieve of negatieve rol heeft gespeeld in het voorbije jaar. Taaltechnologen hebben een computermodel gebouwd waarmee zij de uitkomst voor 2013 voorspelden. Dit model maakt uitsluitend gebruik van de artikelen die tijdens de voorafgaande jaargang door het blad zelf zijn gepubliceerd.

Learning to rank

Via kwantitatieve methodes uit de computertaalkunde kan men de ‘culturele impact’ van personen meten in teksten. Als iemand bijvoorbeeld gedurende lange tijd wordt vermeld in een onafgebroken reeks nummers van Time, is dat veelzeggend. In plaats van gebruik te maken van louter frequentie-informatie, maakt het model gebruik van ‘learning to rank’, een geavanceerde technologie die vaak door online zoekmachines wordt toegepast. Het model maakt bovendien handig gebruik van informatie op Wikipedia om dubbelzinnige persoonsnamen te ‘desambiguëren’. Een computer weet immers niet onmiddellijk over welke ‘Clinton’ het gaat in een tekst.

29 procent bij het rechte eind

De onderzoekers hebben hun model getest op eerdere ‘Persons of the year’. Voor de periode 1923 … 2006, stond de ‘Person of the Year’ in maar liefst 78 procent van de gevallen in de top-10 van het model. In 29 procent van de gevallen kon het model de juiste persoon op de eerste plaats rangschikken.

Dit zijn uitmuntende scores omdat het magazine in elke jaargang vaak meer dan 5000 verschillende personen vermeldt. Soms verkiest het tijdschrift ook abstracte groepen zoals ‘The American Soldier’ in 2003 of ‘You’ in 2006. "Op dergelijke keuzes bijt het model, begrijpelijk, zijn tanden stuk", aldus Mike Kestemont (Universiteit Antwerpen).

Folgert Karsdorp (Meertens Instituut / Radboud Universiteit Nijmegen) licht verder toe: "Het is verrassend dat deze beslissing in veel gevallen vrij goed is te modelleren. Misschien hebben we het voor 2013 bij het juiste eind, misschien niet. De redactie van Time heeft steeds het laatste woord en zij deinzen er niet voor terug om helemaal op het einde nog voor een aardige verrassing te zorgen." En dat is dit jaar inderdaad het geval: Paus Franciscus is gekozen tot ‘Person of the Year’, terwijl zijn naam niet eens in de voorspelde top-10 voorkomt. Ook de twee andere namen in de top-3, Edward Snowden en Edith Windsor, ontbreken in de voorspelling.

Barack Obama?

Voor 2013 voorspelde het model onderstaande rangschikking, met Barack Obama op eerste positie en een opvallende derde plaats voor actrice Miley Cyrus. De zopas overleden Mandela valt net buiten de top-10 in deze lijst.

1: Barack Obama

2: Vladimir Putin

3: Miley Cyrus

4: George W. Bush

5: Angelina Jolie

6: Katie Couric

7: David Bowie

8: Rush Limbaugh

9: John Kerry

10: Hamid Karzai