Il modulo si propone di familiarizzare lo studente con i sistemi ad alte prestazioni per il trattamento e l'analisi di Big Data. Lo studente acquisirà competenze nell'uso di piattaforme NO-SQL per l'interrogazione e il mining di dataset di grandi dimensioni come alternativa dei sistemi di gestione di basi di dati tradizionali.
Il corso descrive le tecniche, le metodologie, gli strumenti di programmazione e di calcolo per condurre analisi quantitative ed estrarre conoscenza da BigData anche quando l'elaborazione richiede l'uso di gradi risorse di calcolo.
Python, Hadoop, Pig, Hive, MongoDB, Spark
Ove possibile verrano riutilizzati dataset già studiati in altri corsi.
Lo studente acquisirà la padronanza di strumenti di calcolo dal alte prestazioni per piattaforme distribuite, e sperimenterà la loro applicazione a dati reali e ad analisi condotte durante il master.