Rozwiązanie przygotowane przez ekspertów z laboratorium IBM Netezza pozwoliło na gromadzenie i analizowanie komentarzy, krótkich wiadomości, postów oraz innych wypowiedzi dotyczących danego zagadnienia w blogosferze. Drugi etap polegał na wydobyciu i uporządkowaniu przydatnych informacji. Dokonano więc ilościowej i jakościowej klasyfikacji opinii zamieszczonych w Internecie, zorganizowanych wokół ściśle okreslonego wydarzenia, jakim było Euro2012. Ostatecznie, treść została poddana głębszej analizie w celu pozyskania informacji dotyczących głównych tematów, wydźwięku odczuć, percepcji i uczuć użytkowników.
- Przykładowo, aż 31 procent użytkowników mikroblogów przewidziało właściwy wynik meczu półfinałowego Niemcy-Włochy (1:2), a 50 procent użytkowników Twittera trafnie wskazało na zwycięstwo reprezentacji Hiszpanii w meczu finałowym z Włochami. Również opinie na temat państw gospodarzy Euro 2012, Polski i Ukrainy przedstawiały w większości nastawienie pozytywne.
- Analizy „IBM Social Sentiment Index” wskazały również, że media społecznościowe pełnią obecnie swoistą rolę pulsometra, badając aktualne emocje w sieci. Jak można było się spodziewać, naukowcy z IBM odnotowali, że nawiększa liczba wpisów (tzw. tweetów) na portalach społecznościowych w czasie Euro 2012 miała miejsce w godzinach trwania meczów, ze wzrostem natężenia tuż po zdobyciu bramek. Po zakończonych meczach i przed meczami tweetów było już znacznie mniej.
Jak szybko komentowaliśmy
Na uwagę zwraca również fakt, z jaką prędkością poszczególne komentarze, były rozpowszechniane i jak wyglądał przeciętny „czas życia” pojedynczej wiadomości. Informacje, które dotyczyły bardzo popularnych wydarzeń – takich jak sporny gol Ukrainy, w meczu przeciwko Anglii - były przekazywane przez użytkowników najczęściej przez okres kilkudziesięciu minut po zdarzeniu. Po tym okresie dana informacja przekazywana była jedynie sporadycznie. Z drugiej strony informacje te w bardzo krótkim czasie, często poniżej kilku minut, miały szansę dotrzeć do milionów odbiorców (przyjaciół bądź obserwatorów), dzięki sieci powiązań pomiędzy nimi. Również rodzaj informacji zawartych w mikroblogach oraz sposób ich zamieszczania mówi wiele zarówno o zainteresowaniach użytkowników jak i o tempie, z jakim je tracą.
- Analizy danych przeprowadzone zostały przy wykorzystaniu zaawansowanej technologii IBM Netezza Analytics, która łączy hurtownię danych oraz analitykę bazodanową w jedną skalowalną, wysoce wydajną platformę analityczną do przetwarzania równoległego na wielką skalę. Została ona zaprojektowana do przetwarzania wolumenu danych mierzonych w petabajtach.