L'obiettivo di questa pagina è fornire le informazioni che possono essere utili ai candidati in fase di scelta dell'Elaborato, Stage e/o Tesi per la Laurea in Ingegneria (area dell'informazione: Informatica, Elettronica e Telecomunicazioni) oppure di Informatica di Scienze, triennale e/o Specialistica/Magistrale e/o Master in modo che, stimolati da questi argomenti, possano sentirsi maggiormente motivati ed interessati ad un eventuale colloquio per discutere del/della loro Stage/Tesi presso il Laboratorio DISIT. Agli elaborati e tesi è possibile congiungere lo Stage o il Laboratorio con i relativi crediti.
CORSI / TESI per:
-- triennale corso: Sistemi Distribuiti
-- magistrali in Artificial Intelligence, Ingegneria Informatica i corsi ed i project work on:
Big Data Architecture, Knowledge Engineering, System Security and Data Privacy / Cybersecurity and Data Privacy
-- vari corsi di Dottorato: DINFO, PhD-AI, etc.
-- master: Big data and Artificial Intelligence (master MABIDA)
-- master: BIM management
TUTTI I SEGUENTI ELABORATI E TESI POSSONO ESSERE SVILUPPATI DA REMOTO SENZA ACCESSO FISICO AL LABORATORIO. MA ACCEDENDO A STRUMENTI ON LINE FORNITI DAL DISIT LAB oppure sui propri dispositivi se capaci.
doc per chiudere tesi, elaborati, etc. https://www.disit.org/5986
ARGOMENTI PER ELABORATI 2024-25 CODIFICATI (DURATA 4 SETTIMANE) per i corsi e per Intership (ELEMENTI PER TESI):
L'esame consiste nello svolgimento di un elaborato CODIFICATO da concordare con il docente, da questa lista o meno a vostra scelta, durata 4 settimane. Gli elaborati possono essere:
- (Tipo A) con sviluppo di software, soluzioni, moduli o test sperimentali su soluzioni SW open source, come descritto in seguito.
- (Tipo B) con sviluppo algoritmi di Data analytics: Python, Rstudio, Tensor, ML, Deep Learning, BERT, LLM, AI/XAI, etc.
- (Tipo C) con sviluppo di moduli e processi IOT/Node-RED/javaScript per data warehouse.
Lo studente può chiedere la sostituzione dell'elaborato e/o del tutor di laboratorio tramite email al docente. Nei nuovi elaborati assegnati, l'elaborato puo' essere o meno completato con successo raggiungendo o meno gli obiettivi proposti. Lo Studente può decidere di interrompere l'elaborato in ogni momento chiedendo la valutazione e consegnando la relazione breve di alcune pagine. Il voto viene stimato sulla base del lavoro svolto su base qualitativa e quantitativa, in modo comparativo sull'anno in corso. Agli elaborati e tesi è possibile congiungere lo Stage o il Laboratorio con i relativi crediti, e tesi.
Gli elaborati riportati di seguito sono esempi concreti (ma potrebbero essere già stati assegnati), sono disponibili e vengono assegnati a scelta dello studente in ordine di richiesta, l'acquisizione dell'elaborato implica che lo studente intende iniziare entro breve tempo a lavorarci. Si sconsiglia fortemente di acquisire l'elaborato tenendo bloccato l'argomento per mesi prima di iniziare visto che certi argomenti in ambito ICT invecchiano velocemente:
- Tipo A: installazione, integrazione, e/o sviluppo di moduli e componenti software distribuiti, o di visual analytic:
- stensione di gestore dati per la gestione delle Traiettorie, percorsi di persone e mezzi,
- gestione dati provenienti da FLOTTE di AUTO e VEICOLI industriali, collezione dati da OBD2, traiettorie, controllo e manutenzione dei mezzi
- acquisizione di dati GIS (WMS, WFS, etc..) da server distribuiti per la loro visualizzazione su mappa unica Multi data Map
- uso di LLM multimodale come assistente e motore di business intelligence
- evoluzione di modelli di configurazione per deploy di modello semplificato di grappoli di Container, da MicroX a NanoX
- utilizzo di un generatore di configurazioni di container
- realizzazione o uso di un libreria Javascript per l'accesso a dati di terze parti e invio di queste a widget grafici già presenti, Javascript
- Digital Twin 3D della citta: uso di AI and 3D tiles in CESIUM format
- Digital Twin 3D della citta: inserimento di modelli 3D dinamici per la vegetazione
- integrazione di modelli decisionali DSS basati su System Thinking con modelli Neurali, Neuro-Symbolic
- esecuzione di processi system thinking definiti in Node-red su griglia fissa, riporto dei risultati come heatmap
- Extending data ingestion process with NGSI LD compliant brokers, new version wrt the actual
- uso del broker Orion NGSI LD per l'invio di dati verso NIFI Apache
- scelta ed integrazione per sistema di lettura codici di container e targhe da sistema con telecamere multiple.
- Integrazione di processi AI già presenti per lettura targhe, lettura codici, identificazioni condizione di chiusura.
- altro:
- standby
- Simulatore ad agenti per il match domanda offerta, estensione del simulatore DORAM2Plus, verso Kubernetes e container
- processo di rappresentazione dati dal nostro simulatore DORAM2Plus di domanda-offerta verso SUMO-Web3D
- evoluzione di editor Open street Map, modellazione simbolica, gestione su aree multiple a livello di container
- studio e implementazione di soluzioni web e mobile per 2FA integrato su KeyCloak/LDAP
- gestione di container che presentano API di data analytic, plumber, flash: uso di una API manager o sviluppo di un API manager
- gestore dei microservizi di Data Analytics come API
- Aggiunte al 3D model della città, elementi di decoro urbano: alberi, semafori, auto, tramvia, etc.
- studio e uso di Jarvice per la gestione di container su large scale solutions https://jarvice.readthedocs.io/en/latest/
- sviluppo su OCULUS di scenari per la navigazione cittadina, partenza da una soluzione preliminare già presente.
- Autenticazione su broker MQTT keycloak, estensione della versione per NGSI già presente
- connessione di dashboard a sistemi di supporto alle decisioni distribuito Baesiano come SmartDS.
- indicizzazione Open Search di dati complessi multisorgente e accesso multifaceted, processo multitasking di update
- gestione di undo selettivo per soluzioni di business intelligence
- estensione di modelli di routing dinamico vincolato a partire da soluzioni Open Source Graphhopper
- scalabilità front end in PHP, balancing e contesto salvato su database condiviso
- Sviluppo Kit Mobile App, OpenID connect, Snap4City
- gestione di Video Stream multipli verso dashboard, uso di Kurento, turn, etc.
- modellazione di NGSI-V2/LD rispetto alle Smart City API, SSM2ORION
- studio di NIFI draco
- studio di simulatori Open Source per lo studio di movimentazioni logistiche di materiali in città anche con uso di Droni, e guida autonoma
- sviluppo di un sistema di serious game per vehicle sharing (bike and car), con lock-unlock, booking, tracking, etc.
- Studio di IOT Agent FIWARE, IDAS
- sviluppo di strumento di simulazione e calcolo della domanda vs offerta di mobilità con diversi tipi di matrici origine destinazione
- elaborati passati qui oppure si veda in fondo a questa pagina
- modelli e soluzioni di simulazione distribuita, co-simulation, simulation as a service, etc.
- -...
- standby
- TIpo B: studio e sviluppo di algoritmi di data analytic, machine learning su big data con tecniche varie (su architetture NVIDIA (H100, RTX 4090, RTX3090, GV100) con TensorFlow, Keras, ClearML, Optuna, etc.), ambiti: energia, ambiente, industria, mobilità e trasporti, comportamento utente, etc. Algoritmi che possono essere per predizioni, classificazione, riconoscimenti di pattern, anomaly detection, etc.:
- Uso di modelli LLM per ingestion smart di dati, confronto con sistema tradizionale: https://www.snap4city.org/729
- sfruttamento di un LLM già presente in DISIT Lab, eventuale fine tuning
- uso di LLM per il caricamento di dati da tabelle e fogli excel.
- uso di LLM in modello RAG multimodale come assistente cittadino
- sviluppo in python di algoritmi per la generazione di heatmap: IDW, AKIMA o altri, via MLOps
- uno o due modelli per ogni elaborato
- uso di modelli di continuos learning (fast and slow) per la predizione del traffico.
- sviluppo in python sull base di modelli di deep learning già presenti
- modelli PINN per la simulazione di processi fluidodinamici per flussi in autoclavi, simulazione di turbine.
- uso di librerie Modulus, python soluzioni di partenza presenti
- studio e sviluppo di soluzioni neuro simboliche per i modelli predittivi adattivi (semantici ed inferenziali) in connessione all'explainability dell'Artificial intelligence
- come usare i risultati XAI di modelli predittivi per generate concetti simbolici che possono aiutare durante la iperparametrizzazione / training
- uso di LLM per la produzione automatica di processi semaforici
- uso di Generative AI / LLM per l'ottimizzazione di infrastrutture di traffico
- sviluppo procedure di business intelligence per la stima di statistica descrittiva: Typical trends, scatter plot, correlations, average, PCA, etc., sulla based di un set di serie temporali
- UNO sviluppo per ogni elaborato: Sviluppo di processi in Python, MLOps ClearML, che vengono utilizzati tramite API
- altro
- standby chiedere che siamo in attesa di dati:
- analisi di video di sistemi PTZ per tracking di oggetti complessi in movimento, detection e regia automatica
- modelli di autoconsumo e gestione dei dati di consumo in agglomerati che possono avere storage, veicoli elettrici, PV, etc.
- studio della causalità fra eventi di traffico, e RSS, traffic flow, condizioni meteo
- analisi dati da flotte di veicoli elettrici
- analisi di dati wi-fi per le predizioni di presenze, relazione con eventi e dati di altro tipo
- soluzioni e modelli predittivi per la manutenzione di flotte di trasporto
- soluzioni per la gestione e la riduzione di consumi energetici in edifici, distretti e città
- per elaborati passati si veda qui oppure in fondo a questa pagina
- Uso di SUMO per simulazione di reti semaforiche e produzione delle temporizzazioni ottime
- standby chiedere che siamo in attesa di dati:
- Uso di modelli LLM per ingestion smart di dati, confronto con sistema tradizionale: https://www.snap4city.org/729
- Tipo C: Studio e sviluppo di processi in Processing Logic, IOT App in Node-RED/javascript per datawarehouse o per inserimento di logica intelligente Client side o server side, si veda Snap4City per Elaborati IOT App (la pagina non contiene gli open data specifici per lo svolgimento dell'elaborato); La piattaforma di sviluppo è node-red con microservices/nodi presenti.
- https://www.snap4city.org/download/video/Snap4Tech-Development-Life-Cycle.pdf
- acquisizione dati da sorgenti standard riguardanti il traffico
- processo di caricamento dati e matrici OD, ODM, del traffico privato
- processo di caricamento dati e matrici OD, ODM, della domanda di mobilità
- sviluppo di un caso di studio: uso di modelli system thinking per il supporto alle decisioni, sviluppo di un processo node-red che calcola l'albero decisionale in una griglia della città e costruzione di una heatmap usando heatmap manager e API già presente.
- tutto lo sviluppo in node-red con uso di dashboard per la visualizzazione
- Stima con processi di data ingestion di alcuni indicatori SUMI: https://www.snap4city.org/951 visualizzazione in dashboard standard, sviluppo Javascript
- alcuni indicatori sono stati stimati altri possono essere aggiunti in questo elaborato
- sviluppo di processi di ingestion di dati della mobilità in standard NeTEx / SIRI format, verso KB, processo simile già presente in Python per passare da GTFS a KB
- acquisizione di dati da sorgenti esterne, dati di traffico, dati di sharing, dati di tiled 3D
- altro
- standby:
- processi di ingestion dati da operatore telefonico di movimenti persone, matrici OD
- completamento di un gestore di File ed integrazione con una view di caricamento immagini/video da mobile App
- processi di ingestion dati HERE di traffico
- sviluppo di soluzioni di business intelligence: dashboard builder + Javascript: SUMI, PUMS
- valutazione delle prestazioni di dashboard cluster in balance
- sviluppo flussi node-red per interoperability con: sistemi di gestione telecamere
- ricerca di data set interessanti in ambito mobilità, ambiente, energia
- analisi di modelli dati, sviluppo di data model o sfruttamento di data model standard
- caricamento dati in piattaforma data warehouse: Node-RED, NIFI, etc.
- sviluppo macro per NiFi, Node-red
- uso dei dati per analisi statistica descrittiva: in Rstudio o Python
- realizzazione di dashboard per riportare i dati e l'analisi descrittiva tramite IoT App, dashboard builder
- generazione di Javascript da programming language visuale per neofiti e giovanissimi: in https://scratch.mit.edu/
- scratch for Snap4City..... per esempio... come fare ? possibile ?
- creazione di una IOT Application che possa simulare il comportamento di un plastico lego (o sua rappresentazione in 3D) di una città con parcheggi, luci, panchine, cassonetti, camion nettezza, autobus, semafori, flussi, acqua e livelli, scale mobili, ascensori, metropolitana, etc. in modo da simulare i problemi di smart parking, smart biking, traffic routing, people flow, etc.
- per elaborati passati si veda in fondo a questa pagina
- soluzioni IoT healthiness, notifiche ed anomaly detection
- uso di dati gia collezionati e creazione di notifiche in varia forma
- gestione di processi di caricamento dati, anomaly detection, log, gestione allarmi
- fleet management, data from OBU/CANbus
- acquisizione di dati relativi a modelli 3D del sottosuolo, impianti distribuzione acqua, gas, scarichi, etc.
- soluzioni IoT healthiness, notifiche ed anomaly detection
- Assegnato in corso:
- soluzioni di smart parking evolute, sensori smart parking evoluti da testare, collegamento sensore utente, white/black lists
- sviluppo di soluzioni dimostrative mettendo insieme: scenario editor, node-red, e alcuni Python già fatti per il computo di heatmap di vario tipo a partire da sensori con dati già presenti
- standby:
ARGOMENTI DI TESI PER TRIENNALE O MAGISTRALE: INFORMATICA, ELETTRONICA E TELECOMUNICAZIONI, PER ESEMPIO.
Tesi/Stage per Laurea Triennale e/o Magistrale; per Ingegneri Intelligenza Artificiale, Ingegneria Informatica, Telecomunicazioni, informatica di scienze, Inoltre vi sono anche svariate tesi di dottorato.Su svariati argomenti, e' possibile partire con un elaborato e continuare sullo stesso argomento nello stage e Tesi, anche con aggiunta crediti per il Lab.
Agli elaborati e tesi è possibile collegare lo Stage o il Laboratorio con i relativi crediti. Possibili argomenti possono essere inerenti allo studio, sviluppo, sperimentazione di soluzioni (anche estensioni di elaborati riportati nella lista sopra) per:
- tesi triennali
- si parte da i temi di elaborati di tipo A, B o C, o per fusione degli stessi, direttamente nella liste precedenti.
- tesi magistrali
- integrazione/estensione di argomenti A, B, o C.
- etc.
Per alcune Tesi svolte in passato al DISIT segui questo link.
Ogni tesista viene seguito in tutte le fasi da uno o più esperti/ricercatori della materia e dispone delle risorse del laboratorio DISIT e del data center DISIT.
si NOTI che Tutti gli elaborati e tesi possono svolgersi ONLINE senza problemi o riduzione della loro validità direttamente via rete. Vi viene dato accesso alla piattaforma di sviluppo e/o vi vengono fornite macchine virtuali o container per poter creare il vostro ambiente.
Si informa inoltre del Bando Aperto per Borse di Dottorato: Sono disponibili borse di dottorato triennali in vari ambiti, e di borse di Dottorato in Apprendistato con importanti aziende del settore ICT. Se interessati contattate il Prof. Paolo Nesi.
Stage e Tesi vs Progetti di Ricerca
Svariate Tesi rientrano in modo parziale in progetti progetti di ricerca e sviluppo a carattere nazionale ed internazionale in corso di sviluppo al DISIT e/o con partner di ricerca e industriali si veda la pagina relativa ai progetti. Fra questi: SAUSAM del CN Most, CAI4DSA su FAIR PE PNRR, Tourismo Interreg, Snap4ISPRA JRC, Centro Nazionale Mobilità Sostenibile (CN MOST), Lab Congiunto con Ferrovie dello Stato (MORE), EDIH Tuscany X.0, AMMIRARE Interreg, TOURISMO Interreg, ARTER on energy monitoring, ALMAFLUIDA, AMPERE, SmartBed, SODA, Snap4City (Https://www.snap4city.org ), MOSAIC (regionale con ALSTOM), WEEE Life della commissione europea (con regione e camera di commercio), TRAFAIR (CEF della Commissione Europea, con Univ Modena), Feedback (regionale con VAR), Join (regionale), WEEE (LIFE della EC), REPLICATE H2020 (smart city, con comune di Firenze, TIM, ENEL, Thales, etc.), RESOLUTE H2020 (ec, resilience), Sii-Mobility (SmartCity nazionale MIUR), COLLABORA (Smart city nazionale MIUR), RAISSS (bando unico, gestione delle stazioni ferroviarie), TRACE-IT (bando unico segnalamento e metodi formali), ICARO (bando unico, cloud e smart cloud), SACVAR (regionale, analysis delle competenze, crawling regionale, matchmaking), OSIM (natural language processing, comprensione delle competenze), ECLAP, Mobile Medicine, AXMEDIS, Mobile Emergency, IMAESTRO, VARIAZIONI, WEDELMUSIC, MPEG-SMR, TAC++, IMUTUS, QUACK, OMR, TOTS, VISICON, OPTAMS, SAMOPROS, MUSICNETWORK, etc.
In alcuni casi viene riconosciuto un rimborso spese in base al tipo di lavoro ed al progetto in cui la tesi si inserisce. In alcuni casi le attività sono svolte in collaborazione con l'industria, non si delega all'industria la definizione della tesi. E' possibile svolgere il periodo di Stage/Tirocinio/Laboratorio presso il DISIT ed accorpare il periodo di Tesi e di Stage/Tirocinio/Laboratorio con lo stesso argomento. Si veda per dettagli la pagina dei progetti.
Competenze necessarie per la Tesi
Non sono richieste particolari conoscenze per l'acquisizione e lo svolgimento delle/dei suddette/i Tesi/Elaborati. Laureandi in Ingegneria Informatica, o Elettronica, o delle Telecomunicazioni o Automatica, come anche Laureandi in Informatica, sono tutti in grado di acquisire tali Tesi e di arrivare alla loro conclusione con successo in tempi previsti dal manifesto degli studi, dipendentemente dal tipo di Tesi e dal tempo che il candidato intende dedicarci: esami in sospeso, eventuale lavoro, Laurea Triennale o Magistrale, stage, etc.
Nella durata è incluso il tempo per l'apprendimento delle basi necessarie incluse le tecnologie che saranno utilizzate. Per le Tesi del nuovo ordinamento si prevede una durata di circa 2-3 mesi. Ogni Tesista viene seguito da 1-2 persone che hanno un'approfondita competenza nel settore e nelle tecnologie specifiche e che lo affiancano in ogni momento, sono a sua disposizione.
Alla tesi si puo' connettere anche il laboratorio e/o lo stage.
Tecnologie per elaborati, stage e tesi
I Tesisti/Elaborandi lavorano tipicamente utilizzando tecnologie innovative e svolgono la loro attività dove preferiscono, per esempio presso lo stesso Lab DISIT o Lab INEA-lab o altrove. In ogni caso, viene fornito accesso continuato al Lab DISIT dalle 8:15 alle 20:00 (tutti i giorni) dove possono trovare chi gli assiste (ricercatori, dottorandi, assegnisti di ricerca) nelle loro attività e li puo' aiutare ad affrontare qualsiasi tipo di problematica durante la loro formazione.
si NOTI che Tutti gli elaborati e tesi possono svolgersi ONLINE senza problemi o riduzione della loro validità direttamente via rete. Vi viene dato accesso alla piattaforma di sviluppo e/o vi vengono fornite macchine virtuali o container per poter creare il vostro ambiente.
Il candidato puo' lavorare da solo o in gruppo, comunque avrà la possibilità di apprendere metodi, metodiche e tecniche per l'analisi e la progettazione di sistemi complessi e distribuiti in base al suo argomento di azione:
- ambienti data analytics, machine learning: Python, R Studio,
- Tensor Flow, Keras (GV100, Titan XP, RTX 3090, RTX 4090, A 4500, etc.), Java, Map Reduce, etc.
- varie schede NVIDIA e cluster per oltre 160.000 GPU cores
- tecniche di programmazione: Javascript, Python, PHP, Java, GO, C++, JSP, Node-RED, Node.JS, Jquery, Angular, etc.
- embedded programming su schede: Raspberry Pi, Arduino, Android, ESP32, ..
- IOT protocols se necessario: NGSI, LoraWAN, OneM2M, ModBUS, OPC, COAP, MQTT, AMQP, WS, HTTPS/HTTP, etc.
- data warehouse: Node-RED, NIFI, Kafka, etc.
- mobile programming: Apache Cordova multi piattaforma (Android, iOS)
- lavorare con tecnologie specifiche dipendentemente dalla Tesi/Elaborato Scelta.
Le piattaforme di lavoro sono principalmente LINUX, Windows Server, Android, etc. In molti casi, agli studenti vengono forniti degli ambienti completi in macchine virtuali, container in locale o in cloud. Al loro interno sistemi completi già installati. Questo permette di ridurre notevolmente i tempi di realizzazione della tesi/elaborato perche' vengono abbattuti i tempi di installazione e set up, i tempi di apprendimento delle problematiche di gestione di sistema. Allo stesso tempo, lo studente ha la possibilità di cimentarsi con un problema reale potendo, se lo desidera, approfondire le problematiche dell'intero sistema, e capire come si lavora in un contesto reale lavorativo anche in collaborazione con altri.
Tesi e accesso al Laboratorio DISIT
Il Laboratorio DISIT si trova al secondo piano della Facoltà/Scuola di Ingegneria, Via S. Marta 3, lungo il corridoio dell'ala est/destra.
Consegna Elaborato
a conclusione di tesi ed elaborati va prodotto uno ZIP/RAR, su USB o CD/DVD attenendosi ai contenuti descritti a questo link: http://www.disit.org/5986
RICEVIMENTO PER TESI ED ELABORATI IN VIA PREFERENZIALE
Il Prof. P. Nesi riceve tutti i Venerdi dalle ore 11:30 alle ore 13:00, presso il suo ufficio in Via S. Marta, 3, Dipartimento di Ingegneria dell'Informazione (ex DSI), secondo piano ala est (ala destra entrando dal cancello).
Per ricevimento on line contattarmi direttamente su Skype. Cercatemi su Skype usando il mio indirizzo di email: paolo.nesi@unifi.it
Il Laboratorio DISIT e' la porta difronte all'ufficio. E' sufficiente inviare una email a paolo.nesi@unifi.it oppure al ricercatore o ai ricercatori DISIT con i quali vi interessa lavorare.
OLD:
DISIT Lab: Orientamento in Itinere, triennali e magistrali (vecchio)
relazione alla giornata di orientamento del 29 ottobre, ciascun gruppo/laboratorio interessato a partecipare dovrebbe preparare una presentazione di una ventina di minuti che sviluppi i seguenti punti: - ARGOMENTI DI RICERCA (da 3 a 5 slides): breve panoramica degli argomenti di ricerca attivi presso il laboratorio/gruppo - COLLABORAZIONI CON IMPRESE/UNIVERSITA' STRANIERE (1 slide): su quali argomenti di ricerca sono attive collaborazioni con gruppi di ricerca stranieri o aziende (sia italiane che straniere) - TESI TRIENNALE (2 o 3 slides): esempi di argomenti di tesi e panoramica delle conoscenze/competenze acquisite in una tesi triennale - CdL MAGISTRALE (1 o 2 slide per insegnamento): Relazione tra attività di ricerca del lab/gruppo e gli insegnamenti della magistrale. Panoramica delle maggiori competenze/conoscenze acquisite negli insegnamenti magistrali in relazione alla ricerca svolta nel lab/gruppo