Big data sources, crowdsourcing, crowdsensing

Credits: 
2
Hours: 
20
Area: 
Big Data Sensing & Procurement
Teachers: 
Description: 

Il modulo presenta le tecniche di acquisizione di big data dalle principali sorgenti ad oggi disponibili, incluso dati telefonici, dati di navigazione satellitare, dati di acquisto e di consumo e dati da social media e social networks, open data e dati amministrativi, dati da sensori personali e ambientali. Vengono anche discusse le modalità partecipative di raccolta dei  dati attraverso sistemi di crowdsourcing and crowdsensing come i giochi con scopo e le campagne virali.

Notions: 

Il corso presenta alcune “sorgenti” di informazioni che possono produrre Big Data e che sono caratterizzate dalle 3 “v”: volume, velocità e varietà. Vengono forniti alcuni concetti fondamentali per orientarsi all’interno del variegato mondo del crowdsourcing via web, degli open data, del sensing partecipativo ed opportunistico. Inoltre si faranno delle esercitazioni pratiche utilizzando tool e metodi per l’esplorazione dei dataset e si mostreranno alcuni esempi di utilizzo di API (Application Programming Interface) per realizzare dei Mashup tra applicazioni.

Technics and tools: 

Le principali tecniche che si affronteranno riguardano la gestione di grandi quantità di dati, come ad esempio le tecniche di “data cleaning” utilizzate per migliorare la qualità dei dati. Saranno inoltre presentati metodi per raccogliere dati da Web in modo mirato e saranno mostrate le più comuni API per accedere alle informazioni presenti sui Social Media.

Case studies and datasets: 

Questo corso ha come obiettivo la creazione di dataset a partire da varie sorgenti dati, come ad esempio i dati catturati dai Social Media (Twitter, Instagram, Facebook, Youtube, ect), dati estratti da siti Web, dati della rete cellulare (GSM), da dispositivi GPS, mappe satellitari o dati presenti nelle pubbliche amministrazioni. Durante lo svolgimento del corso verranno presentati vari casi di studio, come la creazione di Mashup tra servizi diversi, l’analisi e la visualizzazione di Open Data e lo sviluppo di un semplice webscraper per acquisire informazioni da Web.

Competences: 

Il corso ha l’obiettivo di fornire le competenze di base per la creazione e la gestione di grandi quantità di dati. Si acquisiranno i concetti fondamentali sulla qualità dei dati, data cleaning e tool di raffinamento dei dati. Inoltre saranno svolte delle esercitazioni pratiche per interrogare le API esposte dai più comuni Social Media tramite linguaggi di scripting come PHP.

Partners