TweetGenie: hoe oud ben ik?

Kun je aan taalgebruik zien hoe oud iemand is? Volgens het Meertens Instituut en de Universiteit Twente wel. Ze ontwikkelden TweetGenie om de leeftijd en het geslacht te raden van Nederlandse Twitteraars. Het programma analyseert daarvoor de laatste 200 tweets. Slimme applicatie. Al blijft het schatten van leeftijd tricky, zo blijkt.

Het computerprogramma kijkt alleen naar het taalgebruik van de Twitteraar, niet naar informatie als naam, foto en profiel van de gebruiker. Voor de analyse worden (combinaties van) woorden geassocieerd met man en vrouw, oud en jong.

Kenmerkende woorden voor vrouwen en mannen

Kenmerkende woorden voor jongere en oudere mensen

Nu blijkt dat oudere Twitteraars vaak te jong worden geschat. Zeker vanaf een jaar of 35 worden de fouten groot. Dit komt omdat de verschillen in taalgebruik tussen oudere Twitteraars erg klein zijn. Het verschil in taalgebruik tussen Twitteraars van 40 en 50 jaar is kleiner dan het verschil in taalgebruik tussen 12- en 18-jarige Twitteraars.

Kun jij het beter?

Op de site kunnen mensen zelf testen hoe goed zij leeftijd en geslacht kunnen schatten (ook leuk om te doen). Inmiddels heeft TweetGenie meer dan 27.000 menselijke schattingen en het is interessant om te zien is dat ook mensen moeite hebben met het schatten van de leeftijd van Twitter-gebruikers.

Jongere mensen worden gemiddeld iets te oud geschat, daarna is er een gebied waarbij het gemiddelde heel goed overeen komt met de echte leeftijd, en vanaf een jaar of 30 worden mensen vaak te jong geschat. Aan de hand van de verzamelde feedback wil TweetGenie binnenkort met een upgrade te komen.

Hoe oud ben ik?

Mijn geslacht klopt in ieder geval. Maar verder is TweetGenie ook aardig voor mij, laat ik het daarop houden…

TweetGenie