Information Retrieval

Credits: 
4
Hours: 
42
Area: 
Big Data Sensing & Procurement
Teachers: 
Academic Year: 
2021-2022
2020-2021
Description: 

Il modulo prevede la descrizione della struttura di un motore di ricerca e di strumenti di Text Mining, analizzando le loro caratteristiche e limiti dal punto di vista computazionale, dei parametri precision/recall/F1, e di espressività delle interrogazioni supportate. Il modulo prevede anche una parte hands-on in cui si descriveranno e utilizzeranno alcuni ben noti strumenti open-source Python per il crawling e analisi di pagine web, l’annotazione semantica di testi (TagMe), e l’indicizzazione di collezioni documentali (ElasticSearch).

Technics and tools: 

TagMe, Rake, Python

Partners