2022-2023
Guidotti Riccardo
Riccardo Guidotti è nato nel 1988 a Pitigliano (GR) Italia. Si è laureato con lode in Informatica nel 2013, presso l'Università di Pisa. La sua tesi di laurea si intitola "Mobility Ranking: Human Mobility Analysis using Ranking Measures". Ha iniziato il dottorato di ricerca in Computer Science presso la Scuola per Graduate Studies "Galileo Galilei", (Università di Pisa), nel novembre 2013. Attualmente è membro del Knowledge Discovery and Data Mining Laboratory.
Monreale Anna
È Professore Associato presso il Dipartimento di Informatica dell'Università di Pisa e membro del Knowledge Discovery and Data Mining Laboratory (KDD-Lab), un centro di ricerca congiunto tra ISTI-CNR e Università di Pisa. I suoi temi di ricerca includono lo studio della big data analytics, delle social networks e dei problemi di privacy che possono sorgere durante l'analisi di dati personali e sensibili. Ha partecipato a diversi progetti di ricerca europei, tra cui il più recente PETRA, il cui tema principale è la mobilità in ambito "smart cities".
Pedreschi Dino
È professore ordinario di Informatica all’Università di Pisa ed un pioniere della big data analytics, ovvero l’analisi delle tracce digitali delle attività umane per comprendere la complessità sociale. Dirige con Fosca Giannotti il KDD LAB – Knowledge Discovery and Data Mining Laboratory [kdd.isti.cnr.it] – un centro di ricerca congiunto fra l’Università di Pisa e l’Istituto di Scienza e Tecnologie dell’Informazione del CNR, uno dei primi focalizzati sul “data mining”.
High Performance & Scalable Analytics, NO-SQL Big Data Platforms
Il corso propone l’insegnamento di concetti base del paradigma di calcolo distribuito tramite MapReduce dal punto di vista teorico e pratico, in particolare ci si focalizzerà su Hadoop per lo sviluppo di competenze nell'uso di strumenti di calcolo ad alte prestazioni per il data engineering, l'analisi di dati e l'utilizzo di tecniche di data mining. Gli studenti impareranno come i classici algoritmi di data mining possono essere applicati sui Big Data usando Hadoop (Spark).
Data Management for Business Intelligence
Il modulo presenta tecnologie e sistemi per la progettazione, il popolamento e l'interrogazione di Data Warehouse per il supporto alle decisioni. L’accento viene posto sulle tecnologie e sull’analisi di problemi applicativi utilizzando esempi e casi studio, con esercitazioni in laboratorio. Lo studente acquisirà conoscenze e capacità sulle principali tecnologie per la Business Intelligence come
ETL (Extract, Transform and Load), Data Warehousing, Analytics SQL, OLAP (Online Analytical Processing).
Allineamento
Il modulo ha l'obiettivo di allineare le competenze informatiche ed analitiche di base degli studenti, in particolare in materia di basi di dati, di analisi statistica ed esplorativa dei dati e di linguaggi di programmazione.