Didattica 2017-2018

Il Master Big Data è un master full-time che avrà durata di un anno a partire da Gennaio. L'attività didattica prevede due fasi principali: la prima fase, che copre il periodo da Gennaio a fine Luglio, è dedicata alle lezioni frontali e attività progettuali; mentre la seconda fase, che copre il periodo Settembre-Dicembre, è dedicata al tirocinio di 500 ore che gli studenti svolgeranno presso i nostri partners.

L'attività didattica settimanale durante la prima fase prevede alcune ore di lezioni frontali concentrate dal giovedì al sabato e delle ore di laboratorio (non obbligatorie) durante le quali gli studenti potranno esercitarsi sperimentando sul campo i metodi presentati a lezione con il supporto di tutor. Il consiglio del Master ha stabilito che ai fini del conseguimento del titolo sarà necessaria la presenza obbligatoria dello studente ad almeno il 70% delle ore di lezioni frontali. L'organizzazione didattica settimanale è descritta in dettaglio nelle seguenti immagini:

Crediti Formativi Universitari (CFU)

Il Credito Formativo Universitario (CFU) è l'unità di misura del volume di lavoro di apprendimento, richiesto ad un allievo in possesso di adeguata preparazione iniziale, per l'acquisizione di conoscenze ed abilità richieste da una certa attività formativa. Esso corrisponde a 25 ore di lavoro complessivo, che comprende sia le ore di didattica frontale, sia lo studio individuale, sia altri tipi di attività (come il tirocinio). Ogni attività formativa ha associato un certo numero di crediti, che vengono acquisiti con il superamento di una verifica del profitto, e non sostituiscono il voto.

L'attività didattica sarà supportata dall'uso della piattaforma Moodle, dove gli studenti troveranno tutto il materiale didattico.

 

Insegnamenti 2017-2018

L'attività didattica del Master avrà inizio il 25 gennaio 2018.
Gli insegnamenti previsti, con i rispettivi obiettivi formativi, sono elencati di seguito.
 
Area: Generico
Tools: SQL, MySQL, Python, Excel
Crediti: 4
Ore: 48
 

Il modulo ha l'obiettivo di allineare le competenze informatiche ed analitiche di base degli studenti, in particolare in materia di basi di dati, di analisi esplorativa dei dati e di linguaggi di programmazione.

Tools:
Crediti: 2
Ore: 20
 

Il modulo si propone di introdurre le nozioni etico-legali di privacy, anonimato, trasparenza e discriminazione, anche in riferimento al quadro normativo comunitario e alla sua evoluzione in corso. Saranno mostrati i modelli e le tecnologie di privacy-by-design e di difesa dei diritti degli utenti, che permettono l'analisi di Big Data nel rispetto del diritto alla protezione dei dati personali, alla trasparenza e al trattamento non discriminatorio.

Docenti: Aziende partner
Tutor: Aziende partner
Tools:
Crediti: 2
Ore: 24
 

Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.

Docenti: Aziende partner
Tutor: Aziende partner
Tools:
Crediti: 2
Ore: 24
 

Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.

Tools: Python, HTML5, CSS3, Tweepy, Selenium, Javascript, JQuery
Crediti: 2
Ore: 20
 

Il modulo presenta le tecniche di acquisizione di big data dalle principali sorgenti ad oggi disponibili, incluso dati telefonici, dati di navigazione satellitare, dati di acquisto e di consumo e dati da social media e social networks, open data e dati amministrativi, dati da sensori personali e ambientali. Vengono anche discusse le modalità partecipative di raccolta dei  dati attraverso sistemi di crowdsourcing and crowdsensing come i giochi con scopo e le campagne virali.

Tools:
Crediti: 2
Ore: 20
 

Il modulo mira innanzitutto a presentare le caratteristiche principali dei processi di innovazione nelle imprese e nelle istituzioni. Oltre ad alcuni cenni teorici di economia dell’innovazione, enfasi verrà posta sulla gestione dei processi innovativi (ruolo della R&S, dell’Open Innovation, ecc.). Verranno poi descritte le nuove opportunità di innovazione rese possibili dagli avanzamenti recenti nei processi di raccolta ed elaborazione di dati su vasta scala. Infine, dopo avere spiegato i concetti e i modelli di business model e di start-up, verrà svolto un eservizio di business model innovation teso ad esplorare le potenzialità dei Big Data nell’aprire nuove possibilità di business.

Tools: Python, XAMPP
Crediti: 2
Ore: 20
 

Il modulo ha l'obiettivo di preparare gli studenti alla presentazione della conoscenza estratta dai Big Data attraverso narrazioni che sfruttano la multimedialità. Presenta anche le più significative esperienze recenti di giornalismo e narrazione basate su informazioni quantitative estratte da varie sorgenti di dati.

Tools: SQL, Pentaho, PowerBI, SQLServer
Crediti: 2
Ore: 20
 

Il modulo presenta tecnologie e sistemi per l’accesso, la gestione e l'analisi dei Big Data per il supporto alle decisioni. L’accento viene posto sulle tecnologie e sull’analisi di problemi applicativi utilizzando esempi e casi studio, con esercitazioni in laboratorio. Lo studente acquisirà conoscenze e capacità sulle principali tecnologie per la Business Intelligence ed il Big Data management, incluso le tecnologie di data warehouse e Online Analytical Processing.

Tools: KNIME, Python, Scikit-Learn, Pandas
Crediti: 4
Ore: 40
 

Il modulo si propone di fornire un’introduzione ai concetti di base del data mining e del processo di estrazione della conoscenza, con approfondimenti sui modelli analitici e gli algoritmi più diffusi per il clustering, la classificazione e la scoperta di patterns, anche in riferimento alle nuove sorgenti di Big Data.

Tools: R
Crediti: 2
Ore: 20
 

Il corso introduce gli elementi principali per la comprensione dei mercati finanziari, la loro struttura e l'infrastruttura tecnologica. In particolare, il modulo fornisce un background sulla modellazione empirica di time series finanziari, individuando gli aspetti fondamentali della data science tra cui la memorizzazione dei dati, la latenza, l'high dimensional inference, ecc. Il modulo copre anche l'analisi semantica dei testi da news feed e social network per la previsione finanziaria. Infine, verranno presentati alcuni elementi di applicazioni computazionali e numerici a problemi finanziari, che vanno dal pricing all'ottimal execution e l'ottimizzazione del portafoglio.

Tools: HTTP, HTML5, CSS3, Javascript, D3, NodeJs
Crediti: 2
Ore: 20
 

Il modulo ha lo scopo di presentare metodi di base e tecniche di visualizzazione per la presentazione efficace di informazione preveniente da diverse sorgenti: dati strutturati (relazionali, gerarchie, alberi), dati relazionali (social network), dati temporali, dati spaziali e dati spazio-temporali. Attraverso lo studio di metodi e strumenti esistenti, verranno presentati alcuni scenari di analitica visuale.

Tools: Python, Hadoop, Pig, Hive, MongoDB, Spark
Crediti: 2
Ore: 20
 

Il modulo si propone di familiarizzare lo studente con i sistemi ad alte prestazioni per il trattamento e l'analisi di Big Data. Lo studente acquisirà competenze nell'uso di piattaforme NO-SQL per l'interrogazione e il mining di dataset di grandi dimensioni come alternativa dei sistemi di gestione di basi di dati tradizionali.

Tools: TagMe, Rake, Python
Crediti: 5
Ore: 40
 

Il modulo prevede l'insegnamento dei moduli software che costituiscono un moderno motore di ricerca, e di analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR.

Docenti: Nanni Mirco
Tools: Postgres, PostGis, MAtlas
Crediti: 2
Ore: 20
 

Il modulo si propone di mostrare le principali tecniche di analisi dei dati spazio-temporali relativi al movimento di persone e veicoli al fine di comprendere la mobilità in un territorio. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.

 

Tools: R
Crediti: 2
Ore: 20
 

Il modulo ha lo scopo di fornire agli studenti gli strumenti e le conoscenze necessarie ad analizzare dati su larga scala provenienti da Online Social Networks. Nel modulo vengono presentati gli strumenti di analisi necessari, vengono poi illustrati i risultati ottenuti applicando tali strumenti a vari tipi di reti sociali. Tali strumenti vengono applicati ai due modi principali di rappresentare una OSN tramite grafi, considerando cioè il social e l’interaction graph.
Nel corso delle ore di laboratorio, gli studenti applicano i concetti appresi a lezione su dataset reali di Online Social Networks. Vengono svolti laboratori sull'analisi dei vari tipi di grafo sociale visto a lezione. Gli studenti apprendono così l'utilizzo di strumenti software di riferimento per l'analisi di dati provenienti da Online Social Networks.

Docenti: Esuli Andrea
Tools: Python, Scikit-Learn, Gensim, Tweepy, Nltk
Crediti: 2
Ore: 20
 

Il modulo presenta le principali tecniche di analisi e mining delle opinioni e delle preferenze degli utenti sulla base di Big Data provenienti dal web o da altre sorgenti. Particolare enfasi viene posta sull'uso delle tecniche di text mining per la comprensione del significato emotivo dei testi prodotti dagli utenti sui social media. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.

Docenti: Aziende partner
Tutor: Aziende partner
Area: Generico
Tools:
Crediti: 20
Ore: 500
 

Il periodo di tirocinio previsto dal Master è di 500 ore, corrispondenti a 20 CFU, da svolgersi individualmente o in piccoli gruppi presso una delle aziende ed istituzioni partner del master, sulla base di un progetto concordato e sotto la supervisione di un team di tutor composto da docenti del master e responsabili aziendali.

Al termine del periodo di tirocinio, il candidato redige una tesina per descrivere il lavoro svolto, le metodologie utilizzate e i risultati dell'attività di tirocinio svolta presso l'azienda o l'istituzione ospitante. La tesi viene presentata dal candidato in sede di esame finale del master. La tesina viene valutata in base alla qualità del materiale presentato e alle capacità di analisi e di sintesi dimostrate dal candidato nella stesura della tesina stessa. 

Periodo Tirocino: Settembre - Dicembre.

Tools: Python
Crediti: 2
Ore: 20
 

Il modulo presenta le principali tecniche di analisi delle tracce che gli utenti lasciano come effetto delle interrogazioni ai motori di ricerca sul web (query log). Vengono discusse le principali applicazioni del web mining fra cui la profilazione degli interessi o delle attività degli utenti e l'uso dei query log per varie forme di nowcasting, ovvero previsione a breve di indicatori sociali, economici e culturali. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.

Partners