EN
IT
Obiettivi Formativi
OBIETTIVI FORMATIVI:
Il corso di Business Analytics fornisce allo studente un'introduzione alla modellizzazione delle variabili economiche e gestionali utilizzando metodi di regressione e tecniche multivariate, sia parametriche che non parametriche; l'accento è posto sulle applicazioni commerciali, di marketing e industriali (ad es. controllo della qualità, analisi delle vendite, customer satisfaction, analisi di mercato). Il programma riguarda i modelli di supervised statistical learning correntemente utilizzati per l'analisi della dipendenza (regressione lineare, ANOVA, modello autoregressivo, modelli logit e probit) e le tecniche di unsupervised statistical learning utilizzate per l’esplorazione e la riduzione dei dati (analisi in componenti principali e analisi dei gruppi).
CONOSCENZA E CAPACITÀ DI COMPRENSIONE:
Conoscenza e comprensione di tecniche statistiche parametriche e non parametriche applicate a problemi di marketing, previsione delle vendite e problemi finanziari. Alla fine del corso gli studenti dovrebbero essere in grado di comprendere: (i) come applicare modelli statistici in un approccio supervisionato e non supervisionato; (ii) conoscere le assunzioni e saper formulare ipotesi in merito ad un modello insieme alla conoscenza/comprensione degli strumenti necessari per verificare queste ipotesi; (iii) comprendere le tecniche di selezione del modello e le misure della capacità di previsione del modello. In particolare, gli studenti sapranno dominare:
• Il modello di regressione lineare multiplo
• Il modello Logit e Probit
• L’'analisi della varianza (ANOVA)
• Il modello autoregressivo AR (1)
• L’'analisi dei gruppi
• L’analisi delle componenti principali
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE:
Attraverso esempi su insiemi di dati reali e l'’utilizzo di software statistici come STATA e SAS, verranno mostrate diverse applicazioni dei concetti illustrati a lezione. Agli studenti verrà richiesto di esercitarsi, sia in classe sia a casa, applicando le metodologie statistiche a insiemi di dati e fornendo un commento e una interpretazione dei risultati ottenuti.
AUTONOMIA DI GIUDIZIO:
Gli studenti saranno in grado di scegliere le tecniche statistiche più appropriate e di selezionare il giusto set di variabili esplicative. Sulla base dei risultati ottenuti, saranno in grado di fornire un'interpretazione sulla relazione tra le variabili oggetto di studio. Gli studenti aumenteranno la capacità di analizzare in modo critico e oggettivo situazioni concrete, fenomeni reali e casi di studio.
ABILITÀ COMUNICATIVE:
Gli studenti saranno in grado di preparare report statistici utilizzando grafici, tabelle, figure e più in generale output di software statistico e di corredarli con commenti appropriati.
CAPACITÀ DI APPRENDIMENTO:
Gli studenti potranno accedere alla lettura e alla comprensione di articoli scientifici che utilizzano i metodi multivariati considerati nel programma del corso. Saranno in grado di individuare i metodi più appropriati per rispondere a delle specifiche domande di ricerca.
Learning Objectives
LEARNING OUTCOMES:
The course in Business Statistics provides an introduction to the modelling of economic and management variables using regression and multivariate methods, both in a parametric than a nonparametric framework; the emphasis is on business, marketing and industrial applications. The program will cover models for the analysis of dependence (linear regression, ANOVA, autoregressive model, logit and probit models) and exploratory techniques for data reduction (principal component analysis and clustering analysis).
KNOWLEDGE AND UNDERSTANDING:
Knowledge and understanding of parametric and nonparametric statistical techniques applied to marketing, sales and financial problems. At the end of the course students should be able to understand: (i) how to apply statistical models in a supervised and unsupervised approach; (ii) perfectly know the model’s assumptions and understanding of the tools needed to verify these hypotheses; (iii) understand the model selection techniques and measures of the model prediction capability. In particular, students will manage:
• Multiple Linear regression model
• Logit and Probit model
• Analysis of Variance (ANOVA)
• Autoregressive model AR(1)
• Cluster Analysis
• Principal Component Analysis
APPLYING KNOWLEDGE AND UNDERSTANDING:
Practical evidence of the concepts will be given with examples using statistical software such as STATA and SAS applied on real datasets. The students will have to practice both in class that with homeworks on the use of specific software so to be able to comment and understand the output.
MAKING JUDGEMENTS:
Students will be able to choose the more appropriate statistical techniques and to select the right set of explanatory variables. On the basis of results obtained, they will be able to give an interpretation about the relationship between the variables under study.
COMMUNICATION SKILLS:
Students will be able to prepare statistical reports using graphs, tables, figures and commenting them.
LEARNING SKILLS:
Students will have access to reading and understanding scientific articles using the multivariate methods considered in the course program. They will be able to identify the most appropriate methods to answer specific research questions.
Prerequisiti
Conoscenza di base della statistica descrittiva, del calcolo delle probabilità, delle variabili casuali (definizione, funzione di ripartizione, valore atteso e varianza, v.c. notevoli) e dell’'inferenza statistica (stima puntuale, proprietà degli stimatori, metodi di stima, verifica delle ipotesi: definizioni, test Z, intervallo di confidenza: definizioni, intervallo di confidenza Z). Durante le lezioni saranno richiamate alcune delle sopra citate nozioni base.
Prerequisites
Basic knowledge of descriptive statistics, elements of probability, random variables (Probability density function, Cumulative density function, expected value and variance) and statistical inference (point estimation, properties of estimators, estimation methods, statistical test, confidence interval).
Programma
Lezione 1-2
Modello di regressione lineare
• Introduzione al Modello Statistico
• Modello di regressione lineare
• Stima dei parametri e bontà di adattamento
• Strumenti diagnostici basati sui residui
• Applicazioni ed esempi con Stata/SAS
Lezione 3-4
Modello di regressione lineare multipla
• Algebra matriciale per la regressione lineare
• Stima dei coefficienti di regressione
• Inferenza sui parametri del modello
• Strumenti diagnostici basati sui residui
• Multicollinearità e indice VIF
• Selezione delle variabili: Backward, forward, stepwise
• Applicazioni ed esempi con Stata/SAS
Lezione 5
Analisi della Varianza a una via
• Definizione
• Stima degli effetti
• Applicazioni ed esempi con Stata/SAS
Lezione 6
Logit e Probit
• Modello statistico
• Stima dei parametri e bontà di adattamento
Comparazione tra modelli: indici AIC e BIC
• Matrice di classificazione
• Curva ROC
Lezione 7
Previsione
• Modello Autoregressiovo di lag 1
• Stima dei parametri e inferenza
Lezione 8
• Applications with SAS su dati reali
Lezione 9
• Introduzione ai metodi di Associazione
• Analisi in Componenti Principali (ACP): Introduzione e motivazione (riduzione del numero di variabili, combinazione lineare delle variabili)
• ACP: Introduzione del metodo (autovalori e autovettori, loadings, scores)
Lezione 10
• Metodi grafici (Biplots)
• ACP: Applicazioni ed esempi con Stata/SAS
Lezione 11
• Analisi dei Gruppi non gerarchica: Introduzione, Partizione dei gruppi: K-medie
• Analisi dei Gruppi: Applicazioni ed esempi con Stata/SAS
Lezione 12
• Metodi di raggruppamento gerarchico agglomerativi (Ward, legame singolo, legame completo, legame medio)
• Valutazione dei gruppi (Dendrogramma, pseudo-T, pseudo-T2)
• Analisi dei Gruppi: Applicazioni ed esempi con Stata/SAS
Program
Lecture 1-2
linear regression model
• Statistical model
• Linear regression model
• Parameters estimation and measure of goodness of fit
• Diagnostic tools based on residuals
• Applications and Examples with Stata/SAS
Lecture 3-4
Multiple linear regression model
• matrix approach to linear regression
• Estimation of regression coefficients
• Inferences about regression parameters
• Diagnostic tools based on residuals
• Multicollinearity and VIF index
• Variables Selection methods: Backward, forward, stepwise
• Applications and Examples with Stata/SAS
Lecture 5
One-way Analysis of Variance
• Definition
• Effects Estimation
• Applications and Examples with Stata/SAS
Lecture 6
Logit and probit
• Statistical model
Assesment method: AIC and BIC
• Estimation and goodness of fit
• Classification matrix
• ROC curve
Lecture 7
Forecasting
• Autoregressive model
• Estimation and inference
Lecture 8
• Applications with SAS on real data sets
Lecture 9
• Introduction to Multivariate Statistics
• Principal components Analysis (PCA): Introduction and Motivation (Data dimension reduction, linear combination of variables)
• PCA: Presentation of Method (eigenvalues and eigenvectors, loadings, scores)
Lecture 10
• Graphical Methods (Biplots)
• PCA: Applications and Examples with Stata/SAS
Lecture 11
• Non Hierarchical Cluster Analysis: Overview, Partitional clustering: K-means
• Cluster Analysis: Applications and Examples with Stata/SAS
Lecture 12
• Agglomerative Hierarchical clustering (Ward, single linkage, complete linkage, average linkage)
• Cluster evaluation (dendrogram, pseudo-F, pseudo-T2)
• Cluster Analysis: Applications and Examples with Stata/SAS
Testi Adottati
Lucidi e altro materiale didattico sarà disponibile sul sito web del corso.
• J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Books
Slides and other teaching material will be available on the course website.
- J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Bibliografia
- J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Bibliography
- J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Modalità di svolgimento
Lezioni frontali in classe, esercitazioni, discussioni di casi studio, 8 ore di esercitazione pratica (LAB) usando software statistico. Verranno mostrati esempi di applicazioni utilizzando SAS e STATA. Gli studenti possono replicare gli esempi a casa utilizzando il software gratuito SAS University Edition e possono scaricare numerosi data set dal sito del corso.
Per valutare la propria preparazione sono presenti sul sito test di autovalutazione ed esempi di esame. Al termine del LAB sarà svolta una prova finale facoltativa che permetterà di ottenere fino a 2 punti da aggiungere al voto del test finale.
Durante le lezioni teoriche si svolgeranno dei quiz a inizio e fine lezione tramite Kahoot. al 20% dei migliori studenti sarà dato 1 punto da aggiungere al voto finale. Inoltre, a chi ha fatto almeno 4 podi sarà dato un punto aggiuntivo.
La prova di esame sarà valutata secondo i seguenti criteri:
Non idoneo: importanti carenze e/o inaccuratezze nella conoscenza e comprensione degli argomenti; limitate capacità di analisi e sintesi, frequenti generalizzazioni e limitate capacità critiche e di giudizio, gli argomenti sono esposti in modo non coerente e con linguaggio inappropriato;
18-20: conoscenza e comprensione degli argomenti appena sufficiente con possibili generalizzazioni e imperfezioni; capacità di analisi sintesi e autonomia di giudizio sufficienti, gli argomenti sono esposti in modo frequentemente poco coerente e con un linguaggio poco appropriato/tecnico;
21-23: Conoscenza e comprensione degli argomenti routinaria; Capacità di analisi e sintesi corrette con argomentazione logica sufficientemente coerente e linguaggio appropriato/tecnico
24-26: Discreta conoscenza e comprensione degli argomenti; buone capacità di analisi e sintesi con argomentazioni espresse in modo rigoroso ma con un linguaggio non sempre appropriato/tecnico.
27-29: Conoscenza e comprensione degli argomenti completa; notevoli capacità di analisi e sintesi. Buona autonomia di giudizio. Argomenti esposti in modo rigoroso e con linguaggio appropriato/tecnico
30-30L: Ottimo livello di conoscenza e comprensione approfondita degli argomenti. Ottime capacità di analisi, di sintesi e di autonomia di giudizio. Argomentazioni espresse in modo originale e con linguaggio tecnico appropriato.
Teaching methods
Classroom teaching, exercises, discussion of case studies, 8 hours of practical exercising (LAB) by using statistical software. Examples of applications are shown using STATA and SAS statistical software. Students can replicate the examples at home using the free SAS University Edition software and download numerous datasets from the course website.
To check the preparation, the course of self-assessment texts and exam simulations can be downloaded from the website. At the end of the LAB, an optional final test will be held which will allow to obtain up to 2 points to be added to the final test grade.
There will be quizzes at the beginning and end of the lecture via Kahoot during the theory classes. the top 20% of students will be given 1 point to add to their final grade. In addition, those who have made at least 4 podiums will be given an additional point.
he exam will be assessed according to the following criteria:
Not suitable: important deficiencies and / or inaccuracies in the knowledge and understanding of the topics; limited capacity for analysis and synthesis, frequent generalizations and limited critical and judgment skills, the arguments are presented in an inconsistent way and with inappropriate language;
18-20: just sufficient knowledge and understanding of the topics with possible generalizations and imperfections; sufficient capacity for analysis, synthesis and autonomy of judgment, the topics are frequently exposed in an inconsistent way and with inappropriate / technical language;
21-23: Routine knowledge and understanding of topics; Ability to correct analysis and synthesis with sufficiently coherent logical argument and appropriate / technical language.
24-26: Fair knowledge and understanding of the topics; good analysis and synthesis skills with rigorously expressed arguments but with a language that is not always appropriate / technical.
27-29: Complete knowledge and understanding of the topics; remarkable abilities of analysis and synthesis. Good autonomy of judgment. Topics exposed rigorously and with appropriate / technical language.
30-30L: Excellent level of knowledge and in-depth understanding of the topics. Excellent skills of analysis, synthesis and autonomy of judgment. Arguments expressed in an original way and with appropriate technical language.
Regolamento Esame
L'esame finale è un esame scritto della durata di 1 ora. Sarà sottoposto un test con risposte a scelta multipla e risposte aperte. Le domande verteranno principalmente: sulle ipotesi alla base dei modelli statistici, sull'interpretazione degli outputs, sulle proprietà di alcuni indici statistici. Per ogni risposta chiusa sarà dato un (1) punto se la risposta è giusta, altrimenti 0. Per le domande aperte sarà assegnato un punteggio tra 0 e 2 punti.La valutazione finale sarà riportata in trentesimi.
La prova di esame sarà valutata secondo i seguenti criteri:
Non idoneo: importanti carenze e/o inaccuratezze nella conoscenza e comprensione degli argomenti; limitate capacità di analisi e sintesi, frequenti generalizzazioni e limitate capacità critiche e di giudizio, gli argomenti sono esposti in modo non coerente e con linguaggio inappropriato;
18-20: conoscenza e comprensione degli argomenti appena sufficiente con possibili generalizzazioni e imperfezioni; capacità di analisi sintesi e autonomia di giudizio sufficienti, gli argomenti sono esposti in modo frequentemente poco coerente e con un linguaggio poco appropriato/tecnico;
21-23: Conoscenza e comprensione degli argomenti routinaria; Capacità di analisi e sintesi corrette con argomentazione logica sufficientemente coerente e linguaggio appropriato/tecnico
24-26: Discreta conoscenza e comprensione degli argomenti; buone capacità di analisi e sintesi con argomentazioni espresse in modo rigoroso ma con un linguaggio non sempre appropriato/tecnico.
27-29: Conoscenza e comprensione degli argomenti completa; notevoli capacità di analisi e sintesi. Buona autonomia di giudizio. Argomenti esposti in modo rigoroso e con linguaggio appropriato/tecnico
30-30L: Ottimo livello di conoscenza e comprensione approfondita degli argomenti. Ottime capacità di analisi, di sintesi e di autonomia di giudizio. Argomentazioni espresse in modo originale e con linguaggio tecnico appropriato.
Durante il corso di svolgeranno delle esercitazioni (LAB) non obbligatorie in cui si spiega l'uso del software statistico SAS. Al termine delle esercitazioni si svolgerà una prova scritta (Lab exam) che assegna fino a 2 punti da aggiungere al voto dell'esame finale. Potranno partecipare a questa prova solo chi ha seguito tutte le esercitazioni.
Durante le lezioni teoriche si svolgeranno dei quiz a inizio e fine lezione tramite Kahoot. al 20% dei migliori studenti sarà dato 1 punto da aggiungere al voto finale. Inoltre, a chi ha fatto almeno 4 podi sarà dato un punto aggiuntivo.
Exam Rules
The preparation will be verified through a final exam consisting of a test with multiple-choice and open-ended questions. The final exam is a 1 hour written exam. It will be a test with multiple-choice questions and open-ended questions. The questions will mainly focus on the hypotheses underlying the statistical models, on the interpretation of the outputs, on the properties of some statistical indexes. For each question with a closed answer it will be given as a score 1 if correct, 0 if incorrect; each open question will be given a score between 0 and 2; the final evaluation will be proportionally reported in thirtieths.
The exam will be assessed according to the following criteria:
Not suitable: important deficiencies and / or inaccuracies in the knowledge and understanding of the topics; limited capacity for analysis and synthesis, frequent generalizations and limited critical and judgment skills, the arguments are presented in an inconsistent way and with inappropriate language;
18-20: just sufficient knowledge and understanding of the topics with possible generalizations and imperfections; sufficient capacity for analysis, synthesis and autonomy of judgment, the topics are frequently exposed in an inconsistent way and with inappropriate / technical language;
21-23: Routine knowledge and understanding of topics; Ability to correct analysis and synthesis with sufficiently coherent logical argument and appropriate / technical language.
24-26: Fair knowledge and understanding of the topics; good analysis and synthesis skills with rigorously expressed arguments but with a language that is not always appropriate / technical.
27-29: Complete knowledge and understanding of the topics; remarkable abilities of analysis and synthesis. Good autonomy of judgment. Topics exposed rigorously and with appropriate / technical language.
30-30L: Excellent level of knowledge and in-depth understanding of the topics. Excellent skills of analysis, synthesis and autonomy of judgment. Arguments expressed in an original way and with appropriate technical language.
During the course you will conduct non- mandatory exercises (LAB) in which the use of SAS statistical software is explained. At the end of the exercises there will be a written test (Lab exam) that awards up to 2 points to be added to the final exam grade. Only those who have taken all the Lab lectures will be allowed to participate in this test. There will be quizzes at the beginning and end of the lecture via Kahoot during the theory classes. the top 20% of students will be given 1 point to add to their final grade. In addition, those who have made at least 4 podiums will be given an additional point.
EN
IT
Obiettivi Formativi
OBIETTIVI FORMATIVI:
Il corso di Business Analytics fornisce allo studente un'introduzione alla modellizzazione delle variabili economiche e gestionali utilizzando metodi di regressione e tecniche multivariate, sia parametriche che non parametriche; l'accento è posto sulle applicazioni commerciali, di marketing e industriali (ad es. controllo della qualità, analisi delle vendite, customer satisfaction, analisi di mercato). Il programma riguarda i modelli di supervised statistical learning correntemente utilizzati per l'analisi della dipendenza (regressione lineare, ANOVA, modello autoregressivo, modelli logit e probit) e le tecniche di unsupervised statistical learning utilizzate per l’esplorazione e la riduzione dei dati (analisi in componenti principali e analisi dei gruppi).
CONOSCENZA E CAPACITÀ DI COMPRENSIONE:
Conoscenza e comprensione di tecniche statistiche parametriche e non parametriche applicate a problemi di marketing, previsione delle vendite e problemi finanziari. Alla fine del corso gli studenti dovrebbero essere in grado di comprendere: (i) come applicare modelli statistici in un approccio supervisionato e non supervisionato; (ii) conoscere le assunzioni e saper formulare ipotesi in merito ad un modello insieme alla conoscenza/comprensione degli strumenti necessari per verificare queste ipotesi; (iii) comprendere le tecniche di selezione del modello e le misure della capacità di previsione del modello. In particolare, gli studenti sapranno dominare:
• Il modello di regressione lineare multiplo
• Il modello Logit e Probit
• L’'analisi della varianza (ANOVA)
• Il modello autoregressivo AR (1)
• L’'analisi dei gruppi
• L’analisi delle componenti principali
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE:
Attraverso esempi su insiemi di dati reali e l'’utilizzo di software statistici come STATA e SAS, verranno mostrate diverse applicazioni dei concetti illustrati a lezione. Agli studenti verrà richiesto di esercitarsi, sia in classe sia a casa, applicando le metodologie statistiche a insiemi di dati e fornendo un commento e una interpretazione dei risultati ottenuti.
AUTONOMIA DI GIUDIZIO:
Gli studenti saranno in grado di scegliere le tecniche statistiche più appropriate e di selezionare il giusto set di variabili esplicative. Sulla base dei risultati ottenuti, saranno in grado di fornire un'interpretazione sulla relazione tra le variabili oggetto di studio. Gli studenti aumenteranno la capacità di analizzare in modo critico e oggettivo situazioni concrete, fenomeni reali e casi di studio.
ABILITÀ COMUNICATIVE:
Gli studenti saranno in grado di preparare report statistici utilizzando grafici, tabelle, figure e più in generale output di software statistico e di corredarli con commenti appropriati.
CAPACITÀ DI APPRENDIMENTO:
Gli studenti potranno accedere alla lettura e alla comprensione di articoli scientifici che utilizzano i metodi multivariati considerati nel programma del corso. Saranno in grado di individuare i metodi più appropriati per rispondere a delle specifiche domande di ricerca.
Learning Objectives
LEARNING OUTCOMES:
The course in Business Statistics provides an introduction to the modelling of economic and management variables using regression and multivariate methods, both in a parametric than a nonparametric framework; the emphasis is on business, marketing and industrial applications. The program will cover models for the analysis of dependence (linear regression, ANOVA, autoregressive model, logit and probit models) and exploratory techniques for data reduction (principal component analysis and clustering analysis).
KNOWLEDGE AND UNDERSTANDING:
Knowledge and understanding of parametric and nonparametric statistical techniques applied to marketing, sales and financial problems. At the end of the course students should be able to understand: (i) how to apply statistical models in a supervised and unsupervised approach; (ii) perfectly know the model’s assumptions and understanding of the tools needed to verify these hypotheses; (iii) understand the model selection techniques and measures of the model prediction capability. In particular, students will manage:
• Multiple Linear regression model
• Logit and Probit model
• Analysis of Variance (ANOVA)
• Autoregressive model AR(1)
• Cluster Analysis
• Principal Component Analysis
APPLYING KNOWLEDGE AND UNDERSTANDING:
Practical evidence of the concepts will be given with examples using statistical software such as STATA and SAS applied on real datasets. The students will have to practice both in class that with homeworks on the use of specific software so to be able to comment and understand the output.
MAKING JUDGEMENTS:
Students will be able to choose the more appropriate statistical techniques and to select the right set of explanatory variables. On the basis of results obtained, they will be able to give an interpretation about the relationship between the variables under study.
COMMUNICATION SKILLS:
Students will be able to prepare statistical reports using graphs, tables, figures and commenting them.
LEARNING SKILLS:
Students will have access to reading and understanding scientific articles using the multivariate methods considered in the course program. They will be able to identify the most appropriate methods to answer specific research questions.
Prerequisiti
Conoscenza di base della statistica descrittiva, del calcolo delle probabilità, delle variabili casuali (definizione, funzione di ripartizione, valore atteso e varianza, v.c. notevoli) e dell’'inferenza statistica (stima puntuale, proprietà degli stimatori, metodi di stima, verifica delle ipotesi: definizioni, test Z, intervallo di confidenza: definizioni, intervallo di confidenza Z). Durante le lezioni saranno richiamate alcune delle sopra citate nozioni base.
Prerequisites
Basic knowledge of descriptive statistics, elements of probability, random variables (Probability density function, Cumulative density function, expected value and variance) and statistical inference (point estimation, properties of estimators, estimation methods, statistical test, confidence interval).
Programma
Lezione 1-2
Modello di regressione lineare
• Introduzione al Modello Statistico
• Modello di regressione lineare
• Stima dei parametri e bontà di adattamento
• Strumenti diagnostici basati sui residui
• Applicazioni ed esempi con Stata/SAS
Lezione 3-4
Modello di regressione lineare multipla
• Algebra matriciale per la regressione lineare
• Stima dei coefficienti di regressione
• Inferenza sui parametri del modello
• Strumenti diagnostici basati sui residui
• Multicollinearità e indice VIF
• Selezione delle variabili: Backward, forward, stepwise
• Applicazioni ed esempi con Stata/SAS
Lezione 5
Analisi della Varianza a una via
• Definizione
• Stima degli effetti
• Applicazioni ed esempi con Stata/SAS
Lezione 6
Logit e Probit
• Modello statistico
• Stima dei parametri e bontà di adattamento
Comparazione tra modelli: indici AIC e BIC
• Matrice di classificazione
• Curva ROC
Lezione 7
Previsione
• Modello Autoregressiovo di lag 1
• Stima dei parametri e inferenza
Lezione 8
• Applications with SAS su dati reali
Lezione 9
• Introduzione ai metodi di Associazione
• Analisi in Componenti Principali (ACP): Introduzione e motivazione (riduzione del numero di variabili, combinazione lineare delle variabili)
• ACP: Introduzione del metodo (autovalori e autovettori, loadings, scores)
Lezione 10
• Metodi grafici (Biplots)
• ACP: Applicazioni ed esempi con Stata/SAS
Lezione 11
• Analisi dei Gruppi non gerarchica: Introduzione, Partizione dei gruppi: K-medie
• Analisi dei Gruppi: Applicazioni ed esempi con Stata/SAS
Lezione 12
• Metodi di raggruppamento gerarchico agglomerativi (Ward, legame singolo, legame completo, legame medio)
• Valutazione dei gruppi (Dendrogramma, pseudo-T, pseudo-T2)
• Analisi dei Gruppi: Applicazioni ed esempi con Stata/SAS
Program
Lecture 1-2
linear regression model
• Statistical model
• Linear regression model
• Parameters estimation and measure of goodness of fit
• Diagnostic tools based on residuals
• Applications and Examples with Stata/SAS
Lecture 3-4
Multiple linear regression model
• matrix approach to linear regression
• Estimation of regression coefficients
• Inferences about regression parameters
• Diagnostic tools based on residuals
• Multicollinearity and VIF index
• Variables Selection methods: Backward, forward, stepwise
• Applications and Examples with Stata/SAS
Lecture 5
One-way Analysis of Variance
• Definition
• Effects Estimation
• Applications and Examples with Stata/SAS
Lecture 6
Logit and probit
• Statistical model
Assesment method: AIC and BIC
• Estimation and goodness of fit
• Classification matrix
• ROC curve
Lecture 7
Forecasting
• Autoregressive model
• Estimation and inference
Lecture 8
• Applications with SAS on real data sets
Lecture 9
• Introduction to Multivariate Statistics
• Principal components Analysis (PCA): Introduction and Motivation (Data dimension reduction, linear combination of variables)
• PCA: Presentation of Method (eigenvalues and eigenvectors, loadings, scores)
Lecture 10
• Graphical Methods (Biplots)
• PCA: Applications and Examples with Stata/SAS
Lecture 11
• Non Hierarchical Cluster Analysis: Overview, Partitional clustering: K-means
• Cluster Analysis: Applications and Examples with Stata/SAS
Lecture 12
• Agglomerative Hierarchical clustering (Ward, single linkage, complete linkage, average linkage)
• Cluster evaluation (dendrogram, pseudo-F, pseudo-T2)
• Cluster Analysis: Applications and Examples with Stata/SAS
Testi Adottati
Lucidi e altro materiale didattico sarà disponibile sul sito web del corso.
• J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Books
Slides and other teaching material will be available on the course website.
- J. Neter, M. Kutner, C. Nachtsheim, W. Wasserman, 1996, Applied Linear Regression Models, Irwi
- J. Lattin, J. Carroll, P. Green, 2003, Analyzing Multivariate Data, Thomson
Modalità di svolgimento
Lezioni frontali in classe, esercitazioni, discussioni di casi studio, 8 ore di esercitazione pratica (LAB) usando software statistico. Verranno mostrati esempi di applicazioni utilizzando SAS e STATA. Gli studenti possono replicare gli esempi a casa utilizzando il software gratuito SAS University Edition e possono scaricare numerosi data set dal sito del corso.
Per valutare la propria preparazione sono presenti sul sito test di autovalutazione ed esempi di esame. Al termine del LAB sarà svolta una prova finale facoltativa che permetterà di ottenere fino a 2 punti da aggiungere al voto del test finale.
Teaching methods
Classroom teaching, exercises, discussion of case studies, 8 hours of practical exercising (LAB) by using statistical software. Examples of applications are shown using STATA and SAS statistical software. Students can replicate the examples at home using the free SAS University Edition software and download numerous datasets from the course website.
To check the preparation, the course of self-assessment texts and exam simulations can be downloaded from the website. At the end of the LAB, an optional final test will be held which will allow to obtain up to 2 points to be added to the final test grade.
Regolamento Esame
L'esame finale è un esame scritto della durata di 1 ora. Sarà sottoposto un test con risposte a scelta multipla e risposte aperte. Le domande verteranno principalmente: sulle ipotesi alla base dei modelli statistici, sull'interpretazione degli outputs, sulle proprietà di alcuni indici statistici. Per ogni risposta chiusa sarà dato un (1) punto se la risposta è giusta, altrimenti 0. Per le domande aperte sarà assegnato un punteggio tra 0 e 2 punti.La valutazione finale sarà riportata in trentesimi.
Exam Rules
The preparation will be verified through a final exam consisting of a test with multiple-choice and open-ended questions. The final exam is a 1 hour written exam. It will be a test with multiple-choice questions and open-ended questions. The questions will mainly focus on the hypotheses underlying the statistical models, on the interpretation of the outputs, on the properties of some statistical indexes. For each question with a closed answer it will be given as a score 1 if correct, 0 if incorrect; each open question will be given a score between 0 and 2; the final evaluation will be proportionally reported in thirtieths.