Università degli Studi di Napoli "Parthenope"

Scheda dell'insegnamento

Anno accademico: 
2016/2017
Tipologia di insegnamento: 
A scelta dello studente
Tipo di attività: 
Opzionale
Corso di afferenza: 
Corso di Corso di Laurea Magistrale in INFORMATICA APPLICATA
Settore disciplinare: 
INFORMATICA (INF/01)
Lingua: 
Italiano
Crediti: 
6
Anno di corso: 
2
Docenti: 
PETROSINO Alfredo
Ciclo: 
Primo Semestre
Ore di attivita' frontale: 
48

Obiettivi

Fornire le nozioni del modello stenopeico di fotocamera e delle relazioni geometriche che sussistono tra molteplici immagini di una medesima scena, tecniche recenti di analisi video, quali Bag of Words e quelle basate su tessitura e misure di simmetria, ma soprattutto il ruolo del Machine/Deep Learning in Computer Vision.

Conoscenza e capacità di comprensione: Lo studente deve dimostrare di conoscere e saper comprendere gli aspetti teorici e pratici alla base dei problemi di analisi video (video analytics) quali calssisficazione video, video summarization, video indexing, , con particolare attenzione all’apprendimento automatizzato ed estrazione di informazione da video.

Capacità di applicare conoscenza e comprensione: Lo studente deve dimostrare di saper utilizzare la propria conoscenza acquisita per analizzare dataset video complessi e di grosse dimensioni con la finalità di saper applicate e parametrizzare le più recenti tecniche ed algoritmi per l’analisi video.

Autonomia di giudizio: Lo studente deve essere in grado di valutare in maniera autonoma le complessità insite nei dataset video e saper individuare e valutare i punti di forza e di debolezza degli algoritmi noti di machine/deep learning per risolvere problemi di classificazione e clustering su video.

Abilità comunicative: Lo studente deve essere in grado di argomentare con rigore scientifico e terminologia appropriata i complessi concetti teorici delle tecniche di machine/deep learning nonché saper elaborare una valutazione critica dei risultati derivanti dalla sperimentazione su casi reali di studio.

Capacità di apprendimento: Lo studente deve essere in grado di aggiornarsi sulle proposte emergenti di machine learning e deep learning in letteratura scientifica. Deve altresì essere in grado di approfondire in modo autonomo i temi presentati durante il corso in modo da elaborare una personale visione dello stato dell’arte.

Prerequisiti

E’ necessaria una buona conoscenza della analisi matematica fondamentale alla comprensione delle tecniche e gli algoritmi presentati al corso.

Contenuti

Il corso mira a fornire allo studente competenze e conoscenze relative alla Computer Vision. La Computer Vision consiste nel dedurre le proprietà del mondo in base a una o più immagini digitali attraverso algoritmi per l'analisi di immagini e video basati su colore, trama, ombreggiatura, stereo e movimento. Include lo studio del modello stenopeico di fotocamera e delle relazioni geometriche che sussistono tra molteplici immagini di una medesima scena, tecniche recenti di analisi video, quali Bag of Words e quelle basate su tessitura e misure di simmetria, ma soprattutto il ruolo del Machine/Deep Learning in Computer Vision.

Metodi didattici

L'insegnamento consiste in un totale di 48 ore (6 CFU).
L'insegnamento consiste in lezioni teoriche e pratiche sugli argomenti trattati dal corso. Si svolge in classe o in laboratorio ed è organizzato in lezioni di 2 ore contrassegnate dal calendario accademico.
Le lezioni di laboratorio hanno lo scopo di indirizzare a codici già presenti sul web relativi agli argomenti teorici visti in classe, discutendo sull'efficace implementazione algoritmica e mettendo in evidenza le sue potenzialità e limitazioni sui diversi set di dati video disponibili online.

Verifica dell'apprendimento

Agli studenti verrà chiesto di studiare un articolo a loro scelta tra gli articoli scientifici in versione Open Access, forniti dalla Computer Vision Foundation e presenti all’url

http://openaccess.thecvf.com/menu.py

e di produrre una relazione scritta come progetto da inviare/inviare al docente per la valutazione.

Il report può essere solo correlato agli aspetti teorici o, sempre a scelta personale, ad un codice disponibile sul web, coerente in una sequenza di passaggi di analisi delle immagini che portano all'interpretazione dell'immagine, sottolineando così l'esperienza.

È possibile lavorare in un gruppo di 2 studenti e produrre un singolo report.

Lo studente può anche – in modo facoltativo - consegnare/inviare in modo opzionale ed a sua discrezione una presentazione in Power Point (o simile) con audio registrato correlato alla relazione cartacea. Possibile struttura del rapporto:

Introduzione:
Introdurre l'argomento, fornire una breve panoramica dell'argomento. Segnala con argomenti precedenti: Descrivere brevemente gli aspetti tecnici dei principali risultati nell'area.
Revisione del lavoro precedente: Questa è una sezione importante. Spiegare i dettagli del metodo e la soluzione tecnica proposta dagli autori del lavoro scientifico selezionato.

Parte tecnica:
Riepilogo delle soluzioni tecniche adottate nel lavoro scientifico selezionato, seguito dai dettagli delle soluzioni tecniche.

L'esame consiste in un progetto per un peso complessivo del 90% e di un orale inerente al commento del progetto per il 10%.

Testi

A. Fusiello: Visione Computazionale: tecniche di ricostruzione tridimensionale. Franco Angeli, Milano. 2018 (2 ed.)

B. Forsyth & Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall, 2012, ISBN-10: 013608592X, ISBN-13: 978-0136085928
Il libro è accessibile all’url
http://cmuems.com/excap/readings/forsyth-ponce-computer-vision-a-modern-...

Lezione su e-learning http://e-scienzeetecnologie.uniparthenope.it su Deep Learning tenuta dal Prof. Petrosino

Altre informazioni

Il materiale didattico, in lingua inglese, è accessibile in modalità elearning al link http://e-scienzeetecnologie.uniparthenope.it. Per fruire dei contenuti pubblicati sulla piattaforma, lo studente deve essere regolarmente registrato ed iscritto al corso. Il ricevimento si concorda tramite email.