Università degli Studi di Napoli "Parthenope"

Scheda dell'insegnamento

Anno accademico: 
2018/2019
Tipologia di insegnamento: 
Base
Tipo di attività: 
Obbligatorio
Corso di afferenza: 
Settore disciplinare: 
STATISTICA (SECS-S/01)
Lingua: 
Italiano
Crediti: 
9
Anno di corso: 
2
Ciclo: 
Secondo Semestre
Ore di attivita' frontale: 
72

Obiettivi

Il corso di Data Mining Per Le Decisioni D’impresa si propone di fornire le competenze essenziali finalizzate alla applicazione e alla scelta delle principali tecniche di analisi di dati multidimensionali: analisi di dipendenza tra fenomeni, classificazione delle unità e sintesi delle informazioni. Con l'esplosione dei problemi dei "Big Data", il data mining è diventato estremamente importante in molti ambiti scientifici, nonché in marketing, finanza e altre discipline aziendali. Il corso parte dai concetti introduttivi relativi alla organizzazione e descrizione dei dati, propone l’elaborazione dei dati attraverso i modelli statistici di base ed affronta, successivamente, la tematica della sintesi statistica attraverso i metodi di analisi multivariata in contesti di data mining. Al fine di fornire allo studente le abilità per interpretare i risultati delle analisi effettuate, durante il corso vengono sviluppate numerose esperienze concrete di analisi delle tecniche statistiche oggetto di studio.
- Conoscenza e capacità di comprensione
L’insegnamento di Data Mining Per Le Decisioni D’impresa si propone di fornire i fondamenti concettuali e metodologici delle più importanti tecniche di data mining impiegate nei processi di estrazione di conoscenza dai dati, spendibili all'interno di enti, organizzazioni e aziende, con l'obiettivo di pianificare e svolgere le attività di organizzazione, trattamento e analisi dei dati al fine di supportare le decisioni aziendali. Le conoscenze e capacità di comprensione vengono principalmente acquisite tramite la partecipazione attiva dello studente alle lezioni frontali e tramite lo studio individuale.
- Capacità di applicare conoscenze e comprensione
Lo studente sarà capace di:
- realizzare analisi di dati aziendali, ricerche di mercato, analisi di contesto;
- gestire la modellazione, l'analisi e l'interpretazione dell'informazione statistica in studi osservazionali.
- Autonomia di giudizio
Lo studente sviluppa la propria autonomia di giudizio tramite la partecipazione alle discussioni e agli interventi sollecitati dal docente durante le lezioni frontali. Pertanto, egli, anche lavorando all'interno di gruppi di lavoro, sarà in grado di motivare le proprie scelte in fase di analisi, nonché di interpretare i risultati ottenuti, alla luce del problema conoscitivo affrontato.
- Abilità comunicative
Il corso si propone di fornire allo studente le adeguate competenze e gli strumenti necessari per presentare in modo chiaro e rigoroso, utilizzando moderni strumenti di comunicazione, le proprie analisi e relative conclusioni, sia a specialisti che a non specialisti della materia, sia in forma scritta che orale anche attraverso l'utilizzo dei principali applicativi software per il reporting.
- Capacità di apprendimento
Lo studente acquisisce un metodo scientifico di studio ed un approccio ai problemi che gli permette di affrontare in modo autonomo ed efficace tutte le problematiche che si presenteranno nella vita professionale. Egli dovrà essere in grado, in particolare, di individuare autonomamente gli strumenti e le metodologie adeguati allo sviluppo ed al potenziamento delle proprie competenze professionali.

Prerequisiti

Il corso presuppone la conoscenza della statistica descrittiva ed inferenziale.

Contenuti

I principali argomenti trattati al corso sono:
• Introduzione al Data Mining
• Informazione statistica per le imprese: fonti informative primarie e secondarie
• Organizzazione dei dati: la matrice dei dati; Data Warehouse e Data MART; Strumenti grafici per la visualizzazione di dati multivariati: Scatterplot matrix e Heatmap (Mappa di calore)
• Tipologie di dati: dati quantitativi e qualitativi; dati temporali e dati spaziali
• Pulizia dei dati: identificazione trattamento degli outliers in ambito uni e multivariato; trattamento dei dati mancanti
• Modello di regressione lineare multipla. Rappresentazione in forma matriciale compatta. Ipotesi per la costruzione del modello
• Stima dei coefficienti del modello di regressione lineare multipla: minimi quadrati ordinari (OLS)
• Misure della bontà di adattamento del modello. Test di ipotesi sui parametri del modello. Diagnostica e analisi dei residui del modello
• Ulteriori sviluppi dell’analisi di regressione.
• Misure di distanza e gli indici di similarità: analisi di raggruppamento (clustering)
• Tecniche di sintesi delle variabili: analisi in componenti principali e analisi delle corrispondenze (semplici e multiple)

Metodi didattici

L’attività didattica si articola in 72 ore di lezioni frontali, durante le quali vengono anche proposti esercizi sugli argomenti trattati. Agli studenti sono inoltre assegnate esercitazioni aggiuntive da svolgere a casa, singolarmente o in gruppo, che vengono poi corrette e discusse durante le ore di lezione (e, se necessario, durante le ore di ricevimento messe a disposizione dal docente).

Verifica dell'apprendimento

L'esame prevede una prova orale, finalizzata ad accertare il livello di conoscenza e la capacità di comprensione raggiunti dallo studente sui contenuti teorici e metodologici indicati nel programma, nonché il grado di padronanza nell’applicazione di specifiche tecniche di analisi. L’esito della valutazione è espresso mediante un voto in trentesimi. Per superare l’esame (voto non inferiore a 18/30), lo studente deve dimostrare almeno una conoscenza di base delle tecniche illustrate durante il corso. Per conseguire il massimo punteggio (ovvero 30/30 e lode), lo studente deve dimostrare un’eccellente conoscenza di tutti i contenuti del corso nonché la capacità di applicarli alla risoluzione di problemi. Anche la capacità espositiva e il grado di padronanza del lessico proprio della disciplina concorrono a determinare il voto finale.

Testi

Gareth J., Witten D., Hastie T., Tibshirani R. (2017), An Introduction to Statistical Learning (Cap. 3 – parr. 3.1-3.3; Cap. 7 – parr. 3.1-3.4)
Zani S. e Cerioli A. (2007). Analisi dei dati e Data mining per le decisioni aziendali, Giuffré Editore (Capp. 1, 3, 6-9)
Dispense a cura del docente.

Altre informazioni