Vorige week gaf Memori collega Wouter Van den Bosch in het kader van een Erasmus Intensive Programme een gastcollege op de Vilnius University of Applied Sciences te Litouwen. Hij sprak er over het stijgende belang van datavisualisatie en wat vandaag wel en niet mogelijk is met betrekking tot het onttrekken en analyseren van gegevens uit sociale media platformen als Twitter en Facebook. Een kort overzicht van de inhoud van deze lezing, met verwijzingen naar enkele interessante bronnen.
Datavisualisatie
Omdat we in onze moderne informatiemaatschappij vandaag steeds meer en sneller informatie te slikken krijgen, wordt datavisualisatie een steeds belangrijker gegeven. Door grote hoeveelheden aan data of informatie op een juist gekozen, visuele manier weer te geven kunnen we ze vaak sneller interpreteren. Afhankelijk van de gekozen visualisatiemethode, zien we bovendien vaak bepaalde patronen of inzichten tevoorschijn komen die ons anders zouden ontgaan. We komen op een heel andere manier in aanraking met informatie, via ons belangrijkste zintuig.
'Data Journalist' David McCandless maakte van innovatieve datavisualisaties zijn expertise en houdt op zijn site 'Information is Beautiful' een dagboek bij rond eigen en andere mooie voorbeelden van datavisualisatie. In onderstaande grafiek, intussen bijna een klassieker in het veld, toont hij de populariteit van zoekopdrachten met Google over enkele typische en minder typische angsten binnen onze maatschappij.
De rode bergen geven weer hoe elk jaar de populariteit van de zoekterm 'violent videogames' (gewelddadige spelletjes) piekt rond april en de kerstperiode. De piek rond de kerstperiode is begrijpelijk. Rond die tijd komen immers heel wat nieuwe games op de markt en laait ook de discussie rond het onderwerp van gewelddadige spelletjes logischerwijs op. De piek in april is minder voor de hand liggend, tenzij je weet dat op 20 april 1999 het tragische bloedbad in de Columbine school plaatsvond. Een mooi voorbeeld van hoe het visualiseren van een anders droge boel cijfers onttrokken uit Google Insights, tot nieuwe inzichten leidt.
Wie zich wil laten inspireren door David McCandless en zijn visie op datavisualisatie bekijkt best eens diens optreden op het bekende TED congres. Op 18 minuten tijd toont hij heel wat inspirerende voorbeelden uit eigen werk.
Social Media Mining
Datamining is hip. Heel wat bedrijven en organisaties zitten met grote databases vol gegevens die potentieel heel waardevol kunnen zijn voor ondermeer marketing en communicatie. Wie koopt onze producten? Wanneer? Welke producten worden samen gekocht? Kunnen we onze doelgroepen op een andere manier gaan segmenteren en zo gerichter benaderen? Heel wat bedrijven en organisaties zijn dan ook op zoek om ook de mogelijke schat aan gegevens binnen sociale media als Facebook en Twitter te benutten. Wat vertelt men over ons? Over onze producten? Wie praat over ons? Wat vindt onze doelgroep belangrijk?
Helaas is dit alles niet vanzelfsprekend. Voor veel van deze Sociale Media reuzen zijn deze data namelijk een potentiƫle bron van inkomsten en toegang tot zulke gegevens wordt dan ook vaak ingeperkt. Op een platform als Facebook zitten de potentieel meest interessante gegevens bovendien nog eens extra beveiligd achter de privacy-instellingen van de individuele gebruikers.
Toch bieden zowel Twitter als Facebook een zogenaamde 'API' aan, een interface die programmeurs de mogelijkheid biedt om bepaalde gegevens op geautomatiseerde wijze te onttrekken aan deze platformen. Dit leidt tot heel wat leuke experimenten. Youropenbook.org laat je bijvoorbeeld toe om te zoeken binnen publieke status-updates van Facebook gebruikers wereldwijd. De hoeveelheid resultaten die je krijgt bij het ingeven van de zoekterm "hate my boss" is een mooie reden om de eigen privacy-instellingen nog eens extra te controleren.
Vooral Twitter blijkt een mooie bron voor datamining te zijn. In tegenstelling tot Facebook zijn de meeste uitlatingen van de Twitter gebruikers immers publiek. Bovendien wordt Twitter steeds vaker gebruikt vanop smartphones voorzien van een GPS functie, waardoor ze ook geografische informatie meekrijgen. Een potentiƫle bron van informatie over wat er op welk moment op een welbepaalde plek ter wereld gebeurd met andere woorden.
"Pulse of the Nation" visualiseert zo bijvoorbeeld het sentiment van Twitter gebruikers in de Verenigde Staten doorheen de dag, op basis van meer dan 300 miljoen Twitter berichtjes. Op basis van een linguistische analyse werd voor elk bericht berekend of het bericht een positieve of negatieve emotie verkondigde. Het geheel werd gebundeld in een erg mooie animatie die de emotie van de Amerikaanse Twitter gebruiker visualiseert doorheen de dag. De meeste berichtjes zijn 's ochtends vrij positief, maar worden eerder negatief geladen doorheen het vorderen van de (werk)dag. Pas 's avonds zien we de meerderheid terug positief geladen worden.
Bovenstaande afbeelding linkt door naar de pagina waar u ook de animatie in HD kwaliteit kan vinden. Men legt er ook uit hoe en met welke middelen men tot dit resultaat kwam. Zeker de moeite!
Pulse of the Nation is een knap voorbeeld en doet nadenken over hoe dergelijke analyses nog kunnen worden ingezet, zowel in de bedrijfswereld als bij de overheid. Zeker wanneer dit in real-time zou kunnen. Maar hebben we hier in eigen land voldoende kritische massa om dergelijke analyses te maken?
Meer informatie
Bronmateriaal en andere voorbeelden zijn te vinden in de slides in bijlage. Geef ons gerust een seintje voor meer informatie.

Memori





