Homepage

SMART CITY ? Come estrarre valore dai dati

http://smartinnovation.forumpa.it/story/106345/come-estrarre-valore-dai-dati-una-soluzione-open

Comuni e regioni stanno producendo centinaia di dati aperti, questi possono effettivamente essere una leva per produrre valore sul territorio, ma al momento queste opportunità sono difficili da cogliere. Il problema principale è la mancanza di interoperabilità fra i dati. Da questo, scaturisce un problema non trascurabile: la mancanza di soluzioni che permettono di produrre un’interoperabilità senza per questo dover rimettere mano a tutti i dati investendo tempo denaro. E’ su questa base che ci siamo attivati per mettere a punto soluzioni aperte per le Smart City.  

L’interoperabilità dei dati aperti e privati
La carenza di interoperabilità fra dati aperti è un fatto che oserei chiamare naturale, e per questo è impossibile o molto difficile da evitare, magari si può ridurre se conviene. I dati aperti sono prodotti da enti diversi, con protocolli diversi, in momenti diversi, con standard diversi, in formati diversi e da persone diverse, etc. Gli standard non aiutano in questo senso perché anche se il file (il data set) è nello stesso formato di basso livello (per esempio un CSV), quello che contiene non è detto che sia semanticamente compatibile a tutti gli altri file dello stesso o di altri tipi. Il problema primario consiste nel fatto che molti di questi dati fanno riferimento alle stesse entità e concetti (un servizio, un indirizzo, un elemento stradale, un punto WiFi, etc.) ma riferendosi con identificativi diversi e in certi casi anche multipli ma non coerenti (per esempio, indirizzo e toponimo). In altri casi, alcuni dati danno per scontate alcune informazioni, che pero' non sono accessibili. Per esempio, la stessa via chiamata in modi diversi, i numeri civici in formati diversi, i CAP, i toponimi, gli indirizzi web, le email, etc. Ognuno di questi elementi può essere scritto in modi diversi e/o errati creando delle differenze che rendono difficile se non molto costosa l’integrazione di dati che provengono da data set diversi. Ai dati aperti si aggiungono i dati privati. Per esempio quelli che vengono prodotti da privati sulla città come: la posizione dei bus (se non sono prodotti da aziende municipalizzate), i consumi energetici, i flussi di persone, etc. Molti di questi dati cambiano in modo sporadico, o lentamente nel tempo con aggiornamenti mensili o semestrali, altri cambiano ogni secondo: parcheggi, sensori, etc. Si vanno pertanto a creare altre discrepanze e discontinuità.
in relazione alla qualita' del dato, rientrano le problematiche della certificazione e qualificazione delle sorgenti, ma alla fine quello che conta è la qualità finale. Il solo fatto di poterli integrare ottenendo dati da più sorgenti permette di rafforzare certi concetti ed eliminare gli errori, aggiungere sinonimi, etc. Pertanto la qualità finale dipende da come questi dati vengono resi interoperabili. Con operazioni di data intelligence è possibile automatizzare l’integrazione, la fusione e la riconciliazione dei dati evitando di farlo in modo manuale, che è certamente troppo costoso, per arrivare ad un validazione e verifica dei dati stessi. 

Ma..? a che serve avere dati semanticamente interoperabili?
Le soluzioni che permettono di rimettere insieme questi dati rendendoli interoperabili rendono possibile l’integrazione e l’interrogazione coerente di grandi moli di dati (statici e real time) che vengono prodotti dall’integrazione delle sorgenti, dei data set. Rispondendo a quesiti del tipo: “ma che cosa c’è ora e cosa è successo in via LargaMaCorta 12 negli ultimi 4 anni ?”, aspettandosi di capire tutto riguardo alle fermate del bus, i ritardi, gli incidenti, i servizi, le votazioni, ma anche i parcheggi vicini, le colonnine di ricarica, le code, la popolazione, i VIP name e la loro storia, etc. Bello vero! Ma a che serve? Serve a produrre valore! Puo' servire a capire se ha senso aprire un nuovo servizio, negozio. Serve per capire come mai la sede stradale di via LargaMaCorta viene rimessa a posto spesso, e come dice Mario “è sempre bucata”, come mai i cassonetti sono sempre pieni, etc. e Pertanto, puo' servire per metterci rimedio, adeguare il servizio. Il valore viene dalla maggiore efficienza, dai migliori servizi, dai minori costi. Ma può anche semplicemente servire per facilitare le aziende e le imprese a fornire  informazioni private contestualizzate alla città. Il ristorante che informa quali sono i servizi che vi sono nelle vicinanze, i parcheggi, i bancomat, le rastrelliere bici, i punti di ricarica, etc.

La soluzione Km4City
In questo senso, un modello e strumento d’integrazione, riconciliazione e validazione a supporto del ragionamento sui dati smart city è stato sviluppato al DISIT lab che ha integrato una buona parte dei dati del Comune di Firenze e della Regione Toscana, anche in relazione al progetto Sii-Mobility, smart city nazionale; ed a progetti Europei in collaborazione con il Comune di Firenze. A questo fine il primo passo è stato la definizione di un’ontologia di riferimento, chiamata KM4City, accessibile in forma aperta su http://www.disit.org/6461 in Italiano, ver 1.3. Il modello KM4City ed i suoi strumenti permettono di automatizzare l’integrazione dei dati, renderli interoperabili, e fare ragionamenti e deduzioni sui dati cittadini, per fare smart city e per il supporto alle decisioni. I primi risultati sono accessibili per comprendere il modello dati sono visibili per esempio in relazione ad una fermata del bus http://log.disit.org/service/index.php?uri=http://www.disit.org/km4city/resource/FM0084&sparql=http://192.168.0.205:8080/openrdf-sesame/repositories/km4city36&keyword=Fermata%20di%20Piazza%20San%20Marco,%20real%20time%20status&multiple_search=false dove chi è più tecnico può accedere al modello semantic con uno strumento che permette la navigazione nel RDF Store via SPARQL.