In questo corso verra' presentata
un'introduzione agli algoritmi per l'apprendimento automatico e il data
mining. Questi algoritmi sono alla base di molte importanti
applicazioni innovative dell'informatica come il riconoscimento
automatico dei caratteri stampati e manoscritti, il riconoscimento
vocale, il text mining, la classificazione dei documenti, il
riconoscimento delle forme, la computer intrusion detection, i
filtri anti-spam, e l'estrazione di informazioni dalle pagine web. Ogni
algoritmo di apprendimento automatico ha sia un aspetto computazionale
(come calcolare la risposta) che un aspetto statistico (come assicurare
l'accuratezza delle predizioni). Gli algoritmi presentati
nel corso includono learners lineari (Gaussian maximum
likelihood, Naive Bayes, regressione logistica) e learners non
lineari (decision trees, support-vector machines, nearest
neighbor methods). Inoltre verranno introdotti anche metodi
di ensemble avanzati come il bagging e il boosting. Per
chiarire i principali algoritmi e tecniche esposte saranno presentati
vari esempi e esercizi numerici.
Il corso non tratta le reti neurali, in quanto questo argomento
e' già coperto dal corso di Reti Neurali I e
viene quindi considerato un pre-requisito. Nel presente a.a. 2003/04,
il corso di Apprendimento Automatico e quello di Reti
Neurali II trattano argomenti complementari sviluppati a partire
dalle basi presentate in Reti Neurali I. E' comunque
garantita agli studenti la possibilita' di seguire anche uno solo dei
due corsi.
Elementi di
algoritmi di ricerca, probabilita', statistica, calcolo differenziale,
algebra lineare, reti neurali.
Introduzione - Apprendimento
Bayesiano - Instance Base Learning - Teoria Statistica
dell'Apprendimento - VC-dimension - Support Vector Machines - Analisi
Bias/Variance Analysis - Metodi per prevenire l' Overfitting -
Valutazione comparazione di Learners - Apprendimento non
supervisionato – Analisi delle Componenti Principali – Analisi delle
Componenti Indipendenti - Apprendimento non supervisionato – Clustering
– Algoritmo EM – C-Means - Clustering robusto - Fuzzy
Clustering - Apprendimento di Concetti - Alberi di Decisione - PAC
Learning, Bound sul numero di esempi - Ensemble di Learners -
Apprendimento con Rinforzo.