Homepage

EXPO2015 l’analisi di TwitterVigilance

EXPO2015 l’analisi di  TwitterVigilance
 

Questa pagina riporta l’analisi dei flussi Twitter relative a EXPO 2015 effettuata tramite lo strumento TwitterVigilance del DISIT lab: http://www.disit.org/tv . Da questo link si possono vedere alcuni canali che sono o sono stati sotto monitoraggio e si può interagire con questi per fare degli approfondimenti. Gli utenti registrati possono ovviamente fare molto di più.
Questa pagina di analisi riporta alcuni esempi che possono essere approfonditi, e che pertanto non rappresenta uan visione esaustiva dello strumento, per altro non facile da produrre.

 

Con EXPO2015 si intende l'Esposizione Universale che si è tenuta a Milano, Italia, a partire dal primo di maggio 2015 fino alla fine di ottobre 2015, tutti i giorni dal Lunedi al Venerdì dalle 10:00 alle 23:00 e il sabato e la domenica dalle 10:00 alle 24:00. Il temi dell’EXPO2015 sono stati  Nutrire il Pianeta, Energia per la Vita e la tecnologia abbracciando innovazione, cultura, tradizioni e la creatività e il loro rapporto con il cibo e la dieta. Hanno partecipato ad EXPO2015 circa 154 paesi, organizzazioni internazionali, organizzazioni della società civile, aziende e organizzazioni non governative. L’EXPO2015 è stato distribuito su una superficie di 1,7 milioni di metri quadrati, 8 grandi padiglioni, circa 7000 eventi e 29 milioni di visitatori in totale.

 
La valutazione di eventi come EXPO2015 via Twitter possono essere effettuate per vari motivi fra questi:

  • Valutazione dei servizi: qualità ed apprezzamento da parte dei visitatori
  • Identificazione precoce di disfunzioni
  • Predizione del numero di visitatori nei giorni successivi per avere adattare alcuni servizi: riduzione delle code aprendo un maggior numero di sportelli, evitare di finire le scorte di cibo, aumentare i servizi di assistenza ai visitatori e le attrazioni.

 

La previsione di visitatori potrebbe essere un valido strumento per la messa a punto dei servizi da una grande differenza del numero di visitatori durante il giorni feriali e week end, o eventi può provocare lunghe code e disfunzioni, quindi problemi nei cancelli di ingresso, servizi generali , e per il cibo e la fornitura di catering (per esempio passando da qualche migliaia di tweet a oltre 15.000 tweet anche solo il giorno dopo). Si prega di notare che il cibo e servizi sono stati l'attrazione principale di EXPO2015. I visitatori del’EXPO2015 sono stati principalmente italiani, europei e di tutto il mondo.
 

Una versione con minori funzionalità del sistema di analisi in continuo di TwitterVigilance per EXPO2015 è accessibile per le analisi:
·         statistica http://www.disit.org/tv/index.php?p=chart_singlechannel&canale=EXPO2015 ,
·         natural language http://www.disit.org/tv/index.php?p=nlp_analysis&canale=EXPO2015
·         Sentiment http://www.disit.org/tv/index.php?p=sent_analysis&canale=EXPO2015

Vi sono molte altre funzionalità fra le quali anche una di ricerca Faceted e di segmentazione risultati che non sono accessibili agli utenti pubblici.
 

Veniamo ai Numeri!!!

Che presentiamo di seguiti in modo ragionato ed aggregato, ma che sono disponibili anche in forma dettagliata e disaggregata al DISIT lab.
 

Il canale di monitoraggio EXPO2015 su TwitterVigilance ha raccolto oltre 1,6 milioni di Tweet in quasi tutte le lingue ma con prevalenza italiana, circa 44,4% di Tweet e 55,6% di retweet nel periodo da aprile a novembre 2015.

 

 
Questa raccolta è stata effettuata sulla base di un set di ricerche iniziali come mostrato in figura seguente.

 
Fra queste ricerche quelle che hanno raccolto maggiormente sono state: #Expo2015 (57%), @expo2015milano (24,5%), #expo2015milano (4,6%), ... #noexpo (1,65%), ecc
 

Non tutti gli hashtag hanno iniziato dall'inizio, molti dei quali hanno avuto una durata limitata. Come per esempio #noexpo prevalentemente all'inizio per la presenza di oppositori. Interessante anche #expomilano2015 che e‘ comparso dopo la metà del mese di luglio (che e’ una trasposizione di #expo2015milano hashtag ufficiale), e che ha prodotto un numero significativo di istanze, come da figura seguente dove sono stati nascosti i segnali delle ricerche che hanno dato maggiori risultati in modo da far emergere quelle sottostanti.



 

Molti altri hashtag pertinenti ad EXPO2015 sono cresciuti durante l'esposizione come: #milano con (8%), #expo (5%), #milan (2,3%). Si noti che la somma di tutte la percentuale supera il 100% poiché molti tweet presentano più di un hashtag.

 

Il rapporto fra Tweet e Retweet per le varie ricerche si e‘ dimostrato diverso mettendo in evidenza alcuni driver per la viralita’ ma solo su certi utenti come per esempio @4expo.

                

Come è noto i visitatori del’EXPO2015 sono stati principalmente italiani, europei ma anche dal tutto il mondo. A livello di lingue si sono riscontrati Tweet in lingua Italiana per il 66,5%, in Inglese per il 20%, Spagnolo 3,9%, Francese 1.25%, etc.

 
Il volume dei tweet e retweet e' stato prodotto da oltre 223.000 utenti unici distinti.

 
Gli utenti più attivi
(quelli che hanno maggiormente twittato, gli influencer) sono stati @PCM_Expo2015, @expo_Milano2015, @4expo, @tuttoexpo2015, @expo2015milano, ecc.
 
Influencer: Fra questi utenti primariamente istituzionali, quelli che hanno ricevuto spesso un numero significativo di retweet è stato principalmente @expo2015milano con varie serie da oltre 1000 retweet. Mentre vi sono stati molti utenti con serie da 1000-2000 retweet e anche oltre ma sempre eventi singoli, su tweet principalmente ironici. Fra i blogger @beppesevergnini e’ stato quello che con singoli tweet ha raccolto maggiori consensi in termini di retweet.

 
Gli utenti di Twitter più citati sono stati (in ordine di citazioni ricevute): @expo2015milano, @pad_ita2015, @askexpo, @euexpo2015, @expoincitta, @raiexpo, ..., @matteorenzi, ecc dove ad  @expo2015milano ha ricevuto circa 500.000 citazioni, raccogliendo circa 10 volte le citazioni del secondo “classificato” @pad_ita2015, utente padiglione Italia.
 

L'intero EXPO2015 è stato sostenuto da migliaia di eventi collocate con politici e vip internazionali, ma non sono mersi a lungo termine utenti e/o hashtag relativi a questi VIP o eventi. EXPO2015 è stato molto di più dei singoli eventi, che rimangono nei dettagli, ma che con TwitterVigilance si possono analizzare comunque come viene mostrato in seguito.

 

Eventi specifici

L’intera manifestazione ha in generale provocato sentimenti positivi (si veda l’analisi di sentiment riportata sotto per il periodo da maggio ad agosto).  Il grafico successivo riporta l’intera analisi su EXPO2015 nella sua globalità di tutte le ricerche indicate in precedenza nelle prime figure, sempre ottenuta tramite TwitterVigilance . Questo grafico rappresenta una visione molto grossolana e sintetica della sentiment analysis e dei dati, ma che puo' essere sufficiente per capire alcune cose ed identificare le situazioni in tempo reale nella maggior parte dei casi.


Con alcuni picchi di positività in giorni specifici, come Sabato 16 Maggio, e l’11 Giugno. Il 16 maggio vi sono state molte inaugurazioni: padiglione biologico, video su obiettivi dell’ONU, e molto altro. L’11 Giugno EXPO2015 ha ospitato il National Day della Santa Sede. Si noti che in tali giorni non vi sono picchi elevati in  termini di numero di Tweet o reTweet.
 

               

Con la serie di grafici sopra si mette in evidenza il  giorno dell’inaugurazione con alcuni punti di  negatività che ora andiamo ad analizzare. Sulla destra della figura precedente si vede l’andamento del sentiment consuntivo per il primo giorno dei Tweet. Si hanno molto tweet positivi ed in seguito alcuni negativi, il bilancio è negativo. Con una seconda visione si possono identificare gli hashtag che dominano nei tweet negativi. Ed in questo caso si nota #noexpo. Un ulteriore approfondimento su questo punto ci porta ad identificare, keyword, aggettivi, sostantivi, soggetti ed i singoli tweet che hanno determinato questa negatività ma anche i corrispondenti volumi sui retweet. Fra i tweet negativi, alcuni sono stati rivolti direttamente ai manifestanti ed in modo ironico hanno ottenuto molti retweet, e molti altri hanno rappresentato le linee della protesta che già erano state manifestate sui quotidiani. In queste condizioni, un’analisi sommaria di sentiment può produrre valutazioni errate.  

 

 

Un Caso di interesse: presenze e code

Un caso interessante può essere la questione delle code e delle attese. Con l’aumentare del numero delle presenze sicuramente si sono avuti aumenti nei tempi di attesa ai padiglioni e all’ingresso. Nel grafico sottostante l’andamento delle presenze giornaliere nel periodo settembre ottobre 2015 (fonte dei dati ufficiale EXPO2015).

 

Nella figura successiva l’andamento del numero dei tweet e retweet in cui i visitatori menzionano code e/o attese, anche se i numeri rispetto ai numeri totali sono molto esigui (un totale di soli 5839 tweet). L’andamento è correlato al numero dei tweet come si può notare confrontando questo ultimo grafico con uno dei primi. Se si scende a livello di analisi si possono avere conferme sui principali problemi come le lunghe attese al padiglione Giapponese, etc.
o
Questo seconda visione sui dati e' stata ottenuta tramite uno strumento di analisi che non viene reso accessibile agli utenti pubblici e che permette la segmentazione e le ricerche facted sull'interno dell'intero volume dei tweet di TwitterVigilance               
 

Predizioni

Un ultimo punto di analisi di correlazione fra alcune metriche derivate dai dati raccolti e il numero di presenze in EXPO2015. Queste come mostrato all’evento del 13 Novembre su Smart City e Big Data di DISIT (slide e video sono disponibili alla pagina: http://www.disit.org/smartcitybigdata2015 ), sono evidenti e permettono di produrre delle previsioni sul numero dei visitatori. Per dettagli si veda prossimamente un articolo scientifico, per ora questo grafico draft anticipatorio e presentato anche su twitter.
 
(a cura del team di TwitterVigilance) per info inviare email a info@disit.org
0
Your rating: None


Warning: Table '.\drupal\sessions' is marked as crashed and should be repaired query: UPDATE sessions SET uid = 0, cache = 0, hostname = '192.168.0.44', session = 'hidePDA|s:1:\"0\";', timestamp = 1715664191 WHERE sid = '46262f76aa0c50c8ca8daf3632880819' in C:\Programmi\Apache Software Foundation\Apache2.2\htdocs\drupal\includes\database.mysqli.inc on line 128