Didattica 2018-2019

Il Master Big Data è un master full-time erogato interamente online che avrà durata di un anno a partire da Novembre. L'attività didattica prevede due fasi principali: la prima fase, che copre il periodo da Novembre a fine Luglio, è dedicata alle lezioni frontali e attività progettuali; mentre la seconda fase, che copre il periodo Agosto-Dicembre, è dedicata al tirocinio di 475 ore che gli studenti svolgeranno presso i nostri partners.

L'attività didattica settimanale durante la prima fase prevede alcune ore di lezioni frontali concentrate dal mercoledì al sabato e delle ore di laboratorio (non obbligatorie) durante le quali gli studenti potranno esercitarsi sperimentando sul campo i metodi presentati a lezione con il supporto di tutor. Il consiglio del Master ha stabilito che ai fini del conseguimento del titolo sarà necessaria la presenza obbligatoria dello studente ad almeno il 70% delle ore di lezioni frontali. L'organizzazione didattica settimanale è descritta in dettaglio nelle seguenti immagini:

Crediti Formativi Universitari (CFU)

Il Credito Formativo Universitario (CFU) è l'unità di misura del volume di lavoro di apprendimento, richiesto ad un allievo in possesso di adeguata preparazione iniziale, per l'acquisizione di conoscenze ed abilità richieste da una certa attività formativa. Esso corrisponde a 25 ore di lavoro complessivo, che comprende sia le ore di didattica frontale, sia lo studio individuale, sia altri tipi di attività (come il tirocinio). Ogni attività formativa ha associato un certo numero di crediti, che vengono acquisiti con il superamento di una verifica del profitto, e non sostituiscono il voto.

L'attività didattica sarà supportata dall'uso della piattaforma Moodle, dove gli studenti troveranno tutto il materiale didattico.

 

Insegnamenti 2018-2019

L'attività didattica del Master avrà inizio il 17 gennaio 2019.
Gli insegnamenti previsti, con i rispettivi obiettivi formativi, sono elencati di seguito.
 
Docenti: Aziende partner
Tutor: Aziende partner
Tools:
Crediti: 1
Ore: 12
 

Questo modulo introduce nozioni della teria dei grafi per analizzare grandi reti socio-economiche. L'analisi poi ci condurrà alla descrizione della modellazione di vari fenomeni e alla corretta definizione di benchmarks con l'uso di un approaccio ispirato alla fisica statistica classica.

Area: Generico
Tools: SQL, Microsoft SQL Server, Python, Excel
Crediti: 4
Ore: 60
 

Il modulo ha l'obiettivo di allineare le competenze informatiche ed analitiche di base degli studenti, in particolare in materia di basi di dati, di analisi esplorativa dei dati e di linguaggi di programmazione.

Tools:
Crediti: 2
Ore: 24
 

Il modulo si propone di introdurre le nozioni etico-legali di privacy, anonimato, trasparenza e discriminazione, anche in riferimento al quadro normativo comunitario e alla sua evoluzione in corso. Saranno mostrati i modelli e le tecnologie di privacy-by-design e di difesa dei diritti degli utenti, che permettono l'analisi di Big Data nel rispetto del diritto alla protezione dei dati personali, alla trasparenza e al trattamento non discriminatorio.

Docenti: Aziende partner
Tutor: Aziende partner
Tools:
Crediti: 2
Ore: 24
 

Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.

Docenti: Aziende partner
Tutor: Aziende partner
Tools:
Crediti: 1
Ore: 12
 

Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.

Tools: Python, HTML5, CSS3, Tweepy, Selenium, Javascript, JQuery
Crediti: 2
Ore: 20
 

Il modulo presenta le tecniche di acquisizione di big data dalle principali sorgenti ad oggi disponibili, incluso dati telefonici, dati di navigazione satellitare, dati di acquisto e di consumo e dati da social media e social networks, open data e dati amministrativi, dati da sensori personali e ambientali. Vengono anche discusse le modalità partecipative di raccolta dei  dati attraverso sistemi di crowdsourcing and crowdsensing come i giochi con scopo e le campagne virali.

Tools:
Crediti: 1
Ore: 12
 

Il modulo mira innanzitutto a presentare le caratteristiche principali dei processi di innovazione nelle imprese e nelle istituzioni. Oltre ad alcuni cenni teorici di economia dell’innovazione, enfasi verrà posta sulla gestione dei processi innovativi (ruolo della R&S, dell’Open Innovation, ecc.). Verranno poi descritte le nuove opportunità di innovazione rese possibili dagli avanzamenti recenti nei processi di raccolta ed elaborazione di dati su vasta scala. Infine, dopo avere spiegato i concetti e i modelli di business model e di start-up, verrà svolto un eservizio di business model innovation teso ad esplorare le potenzialità dei Big Data nell’aprire nuove possibilità di business.

Tools: Python, XAMPP
Crediti: 2
Ore: 20
 

Il modulo ha l'obiettivo di preparare gli studenti alla presentazione della conoscenza estratta dai Big Data attraverso narrazioni che sfruttano la multimedialità. Presenta anche le più significative esperienze recenti di giornalismo e narrazione basate su informazioni quantitative estratte da varie sorgenti di dati.

Tools: SQL, Pentaho, PowerBI, SQLServer
Crediti: 2
Ore: 20
 

Il modulo presenta tecnologie e sistemi per la progettazione, il popolamento e l'interrogazione di Data Warehouse per il supporto alle decisioni. L’accento viene posto sulle tecnologie e sull’analisi di problemi applicativi utilizzando esempi e casi studio, con esercitazioni in laboratorio. Lo studente acquisirà conoscenze e capacità sulle principali tecnologie per la Business Intelligence come

ETL (Extract, Transform and Load), Data Warehousing, Analytics SQL, OLAP (Online Analytical Processing).

Tools: KNIME, Python, Scikit-Learn, Pandas
Crediti: 4
Ore: 40
 

Il modulo si propone di fornire un’introduzione ai concetti di base del data mining e del processo di estrazione della conoscenza, con approfondimenti sui modelli analitici e gli algoritmi più diffusi per il clustering, la classificazione e la scoperta di patterns, anche in riferimento alle nuove sorgenti di Big Data.

Tools: HTTP, HTML5, CSS3, Javascript, D3, NodeJs
Crediti: 2
Ore: 20
 

Il modulo ha lo scopo di presentare metodi di base e tecniche di visualizzazione per la presentazione efficace di informazione preveniente da diverse sorgenti: dati strutturati (relazionali, gerarchie, alberi), dati relazionali (social network), dati temporali, dati spaziali e dati spazio-temporali. Attraverso lo studio di metodi e strumenti esistenti, verranno presentati alcuni scenari di analitica visuale.

Tools: Python, Hadoop, Pig, Hive, MongoDB, Spark
Crediti: 2
Ore: 22
 

Il modulo si propone di familiarizzare lo studente con i sistemi ad alte prestazioni per il trattamento e l'analisi di Big Data. Lo studente acquisirà competenze nell'uso di piattaforme NO-SQL per l'interrogazione e il mining di dataset di grandi dimensioni come alternativa dei sistemi di gestione di basi di dati tradizionali.

Tools: TagMe, Rake, Python
Crediti: 4
Ore: 40
 

Il modulo prevede l'insegnamento dei moduli software che costituiscono un moderno motore di ricerca, e di analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR.

Docenti: Nanni Mirco
Tools: Postgres, PostGis, MAtlas
Crediti: 2
Ore: 20
 

Il modulo si propone di mostrare le principali tecniche di analisi dei dati spazio-temporali relativi al movimento di persone e veicoli al fine di comprendere la mobilità in un territorio. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.

Tools: R
Crediti: 2
Ore: 20
 

Il modulo ha lo scopo di fornire agli studenti gli strumenti e le conoscenze necessarie ad analizzare dati su larga scala provenienti da Online Social Networks. Nel modulo vengono presentati gli strumenti di analisi necessari, vengono poi illustrati i risultati ottenuti applicando tali strumenti a vari tipi di reti sociali. Tali strumenti vengono applicati ai due modi principali di rappresentare una OSN tramite grafi, considerando cioè il social e l’interaction graph.
Nel corso delle ore di laboratorio, gli studenti applicano i concetti appresi a lezione su dataset reali di Online Social Networks. Vengono svolti laboratori sull'analisi dei vari tipi di grafo sociale visto a lezione. Gli studenti apprendono così l'utilizzo di strumenti software di riferimento per l'analisi di dati provenienti da Online Social Networks.

Tools: R
Crediti: 2
Ore: 20
 

Questo modulo presenta metodologie, tecniche e tools di analisi statistica per data science: conoscenza di base della teoria della probabilità, variabili random, modelli statistici, estimation theory, test delle ipotesi, bootstrap, e conoscenza di base dell'analisi delle serie temporali. Il modulo mostra l'applicabilità in casi di studio nel dominio della finanza.

Docenti: Esuli Andrea
Tools: Python, Scikit-Learn, Gensim, Tweepy, Nltk
Crediti: 2
Ore: 20
 

Il modulo presenta le principali tecniche di analisi e mining delle opinioni e delle preferenze degli utenti sulla base di Big Data provenienti dal web o da altre sorgenti. Particolare enfasi viene posta sull'uso delle tecniche di text mining per la comprensione del significato emotivo dei testi prodotti dagli utenti sui social media. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.

Docenti: Aziende partner
Tutor: Aziende partner
Area: Generico
Tools:
Crediti: 20
Ore: 500
 

Il periodo di tirocinio previsto dal Master è di 500 ore, corrispondenti a 20 CFU, da svolgersi individualmente o in piccoli gruppi presso una delle aziende ed istituzioni partner del master, sulla base di un progetto concordato e sotto la supervisione di un team di tutor composto da docenti del master e responsabili aziendali.

Al termine del periodo di tirocinio, il candidato redige una tesina per descrivere il lavoro svolto, le metodologie utilizzate e i risultati dell'attività di tirocinio svolta presso l'azienda o l'istituzione ospitante. La tesi viene presentata dal candidato in sede di esame finale del master. La tesina viene valutata in base alla qualità del materiale presentato e alle capacità di analisi e di sintesi dimostrate dal candidato nella stesura della tesina stessa. 

Periodo Tirocino: Settembre - Dicembre.

Tools: Python
Crediti: 2
Ore: 20
 

Il corso presenta le principali tecninche di analisi dei dati sel web.Usando i query log di un motore di ricerca come un caso di studio, gli studenti sono guidati nello sviluppo di un insieme di metodologie per l'analisi dei dati con lo scopo di creare la base di conoscenza utile a costruire un sistema di raccomandazione. Inoltre il corso discute come la stessa informazione possa essere ottimizzata per il ranking nei servizi web. In particolare il corso introduce tecniche di "learning to rank" che hanno lo scopo di stimare la rilevanza di oggetti rispetto ai bisogni di un utente.
 

Partners