Università degli Studi di Napoli "Parthenope"

Scheda dell'insegnamento

Anno accademico: 
2017/2018
Tipologia di insegnamento: 
Caratterizzante
Tipo di attività: 
Obbligatorio
Corso di afferenza: 
Corso di Corso di Laurea Magistrale in INFORMATICA APPLICATA
Settore disciplinare: 
INFORMATICA (INF/01)
Crediti: 
9
Anno di corso: 
1
Docenti: 
PETROSINO Alfredo
Ciclo: 
Primo Semestre
Ore di attivita' frontale: 
72

Obiettivi

Fornire le nozioni della teoria della probabilità che governano sia i problemi di classificazione e di clustering in pattern recognition. Si studieranno i problemi teorici e si imparerà ad implementare algoritmi evoluti per la classificazione e l’apprendimento su gradi dataset di natura eterogenea.

Conoscenza e capacità di comprensione: Lo studente deve dimostrare di conoscere e saper comprendere gli aspetti teorici e pratici alla base dei problemi di classificazione e clustering in pattern recognition, con particolare attenzione all’apprendimento automatizzato ed estrazione di informazione da dati.

Capacità di applicare conoscenza e comprensione: Lo studente deve dimostrare di saper utilizzare la propria conoscenza acquisita per analizzare dataset complessi e di grosse dimensioni con la finalità di saper applicate e parametrizzare le più sofisticate tecniche ed algoritmi per l’estrazione della conoscenza ai dati.

Autonomia di giudizio: Lo studente deve essere in grado di valutare in maniera autonoma le complessità insite nei dataset di natura eterogenea e saper individuare e valutare i punti di forza e di debolezza degli algoritmi noti di machine learning per risolvere problemi di classificazione e clustering su tali dati.
Abilità comunicative: Lo studente deve essere in grado di argomentare con rigore scientifico e terminologia appropriata i complessi concetti teorici delle tecniche di machine learning nonché saper elaborare una valutazione critica dei risultati derivanti dalla sperimentazione su casi reali di studio.

Capacità di apprendimento: Lo studente deve essere in grado di aggiornarsi sulle proposte emergenti di machine learing e deep learning in letteratura scientifica. Deve altresì essere in grado di approfondire in modo autonomo i temi presentati durante il corso in modo da elaborare una personale visione dello stato dell’arte.

Prerequisiti

Una buona conoscenza della teoria della probabilità matematica e di analisi matematica è requisito fondamentale alla comprensione delle tecniche e gli algoritmi presentati al corso.

Contenuti

Il corso fornisce i fondamenti delle tecniche di machine learning e pattern recognition partendo dalla teoria Bayesiana della decisione, passando per metodi parametrici e non-parametrici, apprendimento supervisionato e non, classificatori e clustering, fino alle reti neurali MLP e il deep learning.

Metodi didattici

L’insegnamento è costituito da un totale di 72 ore (9 CFU) di didattica frontale, ripartite in due moduli di cui uno da 6 CFU per la parte puramente teorica e il secondo modulo da 3CFU per la parte di laboratorio. L’insegnamento si svolge in aula o in laboratorio ed è organizzato in lezioni da 3 ore scandite dal calendario accademico. La didattica frontale consiste in lezioni teoriche e pratiche nonché in esercitazioni tenute dal docente sugli argomenti previsti dal corso. Le lezioni teoriche hanno l’obiettivo di trasmettere allo studente la conoscenza dei fondamenti della teoria della decisione e dei metodi parametrici e non-parametrici per la stima della distribuzione di probabilità dei dati. Le lezioni teoriche affrontano da vicino anche le problematiche connesse ai problemi di classificazione e clustering dei dati nonché alle tecniche per la riduzione della dimensionalità dei dati e per l’estrazione della conoscenza. Le tecniche evolute di apprendimento automatico dai dati concludono la parte teorica del corso con una presentazione accurata dell’apprendimento hebbiano, le reti neurali MLP fino alle tecniche di deep learning con le reti feed forward network con back propagation, le reti neurali convoluzionali (CNN), le Boltzman Machine e le Deep Belief Network (DBN). Le lezioni di laboratorio ripercorrono gli argomenti teorici visti a lezione proponendone una fattiva implementazione algoritmica ed evidenziandone potenzialità e le limitazioni su diversi dataset eterogenei reperibili online. Durante le lezioni di laboratorio sono proposte delle esercitazioni pratiche che svolgono in modo collettivo in aula e che propongono dei quesiti ed esercizi volti a verificare la comprensione degli argomenti trattati. Lo svolgimento degli esercizi proposti dal docente permette di verificare l’applicazione pratica degli argomenti visti a livello teorico e la capacità degli studenti di proporre implementazioni alternative.
È consigliata la frequenza costante del corso che è tuttavia facoltativa. Le prove di esame saranno uguali per tutti gli studenti, frequentanti e non.

Verifica dell'apprendimento

Progetto ed esame orale.
La prova d’esame consiste nell’assegnazione di un progetto individuale attraverso il quale lo studente viene messo alla prova sulla comprensione di un articolo scientifico preso dalla letteratura di settore che affronta un problema di machine learning su una collezione di dati più o meno grande. Lo studente, attraverso la preparazione di una relazione, dovrà mostrare di essere in grado di descrivere e discutere con appropriato rigore tecnico/scientifico la proposta studiata, implementandone una versione fedele alla proposta degli autori dell’articolo, nonché di replicarne ed estendere i risultati scientifici evidenziando criticità e punto di forza del metodo. In questa fase lo studente ha completa autonomia di studio e non è prevista una scadenza per la consegna del progetto.
Lo studente accede alla prova orale solo dopo che ritiene di essere pronto a discutere il proprio progetto e quindi si prenota al primo appello utile per sostenere l’esame. La prova orale è costituita per la prima parte dalla esposizione dell’articolo studiato alla presenza del docente. A tale scopo lo studente può preparare una presentazione con delle slide da mostrare al docente in sede di esame. Terminata la prima parte, la seconda parte dell’orale consiste in domande sui temi teorici del corso in cui il docente valuterà la preparazione dello studente ma anche la capacità di questo ultimo di esprimersi con una terminologia appropriata e di esporre la propria risposta con adeguato rigore tecnico/scientifico.
Il punteggio finale considera sia l’accuratezza della presentazione del progetto che la qualità delle risposte fornite durare il test orale. Il massimo punteggio attribuito all’esame è di 30 punti mentre il minimo per superare la prova è di 18.

Testi

Pattern Classification, 2nd Edition, Richard O. Duda, Peter E. Hart, David G. Stork, ISBN: 978-0-471-05669-0, Wiley-Interscience, 2000

Altre informazioni

Il materiale didattico, in lingua inglese, è accessibile in modalità e-learning al link http://e-scienzeetecnologie.uniparthenope.it. Per fruire dei contenuti pubblicati sulla piattaforma, lo studente deve essere regolarmente registrato ed iscritto al corso.
Il ricevimento si concorda tramite email.