Apprendimento Automatico   (6 crediti)   A.A. 2003/04   

http://www.disi.unige.it/person/MasulliF/AA03.hml  
Ultima modifica:  21 Marzo 2004.  
Commenti a Francesco Masulli.

Docente: Francesco Masulli.

Motivazioni e Obiettivi

In questo corso verra' presentata un'introduzione agli algoritmi per l'apprendimento automatico e il data mining. Questi algoritmi sono alla base di molte  importanti  applicazioni  innovative dell'informatica come il riconoscimento automatico dei caratteri stampati e manoscritti, il riconoscimento vocale, il  text mining, la classificazione dei documenti, il riconoscimento delle forme,  la computer intrusion detection, i filtri anti-spam, e l'estrazione di informazioni dalle pagine web. Ogni algoritmo di apprendimento automatico ha sia un aspetto computazionale (come calcolare la risposta) che un aspetto statistico (come assicurare l'accuratezza delle  predizioni). Gli  algoritmi presentati nel corso includono learners lineari  (Gaussian maximum likelihood, Naive Bayes,  regressione logistica) e learners non lineari (decision trees,  support-vector machines, nearest neighbor methods).  Inoltre verranno introdotti  anche metodi di ensemble avanzati come il  bagging e il  boosting. Per chiarire i principali algoritmi e tecniche esposte saranno presentati vari esempi e esercizi numerici.

Il corso non tratta le reti neurali, in quanto questo argomento e'  già  coperto dal corso di Reti Neurali I e  viene quindi considerato un pre-requisito. Nel presente a.a. 2003/04, il corso di Apprendimento Automatico  e quello di  Reti Neurali II  trattano argomenti complementari sviluppati a partire dalle basi  presentate in Reti Neurali I.  E' comunque  garantita agli studenti la possibilita' di seguire anche uno solo dei due corsi.


Esame

L'esame consiste nella valutazione del seminario (relazione scritta e presentazione) e in un esame orale i cui argomenti sono riportati in dettaglio nel  Syllabus.

Prerequisiti

Elementi di algoritmi di ricerca, probabilita', statistica, calcolo differenziale, algebra lineare, reti neurali.

Programma del Corso


Introduzione - Apprendimento Bayesiano - Instance Base Learning - Teoria Statistica dell'Apprendimento - VC-dimension - Support Vector Machines - Analisi Bias/Variance Analysis - Metodi per prevenire l' Overfitting - Valutazione  comparazione di  Learners - Apprendimento non supervisionato – Analisi delle Componenti Principali – Analisi delle Componenti Indipendenti - Apprendimento non supervisionato – Clustering – Algoritmo  EM – C-Means -  Clustering robusto - Fuzzy Clustering - Apprendimento di Concetti - Alberi di Decisione - PAC Learning, Bound sul numero di esempi - Ensemble di Learners - Apprendimento con Rinforzo.

Ulteriori dettagli del programma sono presenti sul Syllabus.


 

Testi di riferimento


Ulteriore materiale didattico sara' reso disponibile agli studenti durante il corso.