EN
IT
Obiettivi Formativi
Il corso introduce elementi di apprendimento statistico supervisionato e non supervisionato. Il corso è basato sull'uso del software R. Il corso discute inoltre specificamente strumenti di apprendimento automatico.
Risultati dell'apprendimento
Il corso contribuisce al raggiungimento degli obiettivi del corso di laurea, in linea con i profili professionali e gli sbocchi occupazionali previsti, fornendo agli studenti nozioni utili per una comprensione approfondita e critica di alcuni grandi dibattiti de... , tra cui:
CONOSCENZA E COMPRENSIONE: Al termine del corso, gli studenti conosceranno e comprenderanno le basi dell'apprendimento statistico e automatico
APPLICARE CONOSCENZA E COMPRENSIONE: Il corso fornisce gli strumenti per comprendere l'apprendimento supervisionato e non supervisionato. Dopo le lezioni, gli studenti consolideranno la loro conoscenza dei concetti fondamentali della statistica e analisi dei dati. e la loro capacità di applicare autonomamente le conoscenze acquisite all'analisi critica a problemi empirici in ambito socio-economico.
CAPACITA' DI GIUDIZIO: la capacità di trarre giudizi e conclusioni indipendenti sull'analisi dei dati viene stimolata evidenziando le connessioni tra i concetti sviluppati durante il corso, le nozioni acquisite nei corsi precedenti e i legami tra queste nozioni e i principali problemi economici contemporanei.
CAPACITÀ DI COMUNICAZIONE: Frequentando il corso e interagendo con il docente, gli studenti svilupperanno le loro abilità comunicative e la loro capacità di organizzare e condividere ragionamenti articolati, combinando nozioni di statistica e informatica.
CAPACITÀ DI APPRENDIMENTO: Attraverso lo studio dell'apprendimento statistico, gli studenti acquisiranno la capacità di analizzare e approfondire autonomamente argomenti specifici legati ai contenuti del corso.
Learning Objectives
The course covers some statistical techniques for supervised and unsupervised learning. The R software for statistical computing will be also introduced and used throughout.
Supervised learning techniques are used to predict a target variable (linear and logistic regression) based on predictors, and/or to assess interrelationships among predictors and a target variable (linear and logistic regression). As an example, suppose you want to predict the risk that a family will be materially deprived next year. This can be done by using data that can be measured at baseline (number of family members, disposable income, health status, etc.) and use these to predict material deprivation for a sample of families with known status. Machine learning methods will also be discussed (classification and regression trees, random forests, shallow and deep neural networks) for supervised learning. Modern applications will be then introduced, where data is extracted from text corpora (natural language processing), images (computer vision), audio tracks.
Learning Outcomes
The course contributes to the achievement of the objectives of the degree course, in line with the professional profiles and employment outlets envisaged, providing students with notions useful for an in-depth and critical understanding of some major debates in the statistical and computer science community, including:
KNOWLEDGE AND UNDERSTANDING:
At the end of the course, students will get to know and understand the basics of statistical and machine learning
APPLYING KNOWLEDGE AND UNDERSTANDING: The course provides tools to understand supervised and unsupervised learning methods. Following the lectures, students will consolidate their knowledge of the fundamental concepts of statistics and data analysis and their ability to independently apply the knowledge they have acquired to socioeconomic problems.
MAKING JUDGEMENTS: the ability to draw independent judgments and conclusions about data analysis is stimulated by highlighting the connections between the concepts developed during the course, the notions acquired in previous courses and the links between these notions and the major contemporary economic problems.
COMMUNICATION SKILLS: By attending the course and interacting with the two lecturers, students will develop their communication skills and their ability to organise and share articulate reasoning, combining notions of statistics and computer science.
LEARNING SKILLS: Through the study of statistical learning the students will acquire the ability to independently analyse and investigate specific topics related to the course contents.
ALESSIO FARCOMENI
Prerequisiti
Il requisito è un corso introduttivo di statistica e inferenza statistica come "Strumenti Statistici per la Presa di Decisioni" del corso di laurea in Governance Globale. È inoltre necessaria una certa conoscenza di matematica, anche se vengono effettuate solo poche derivate.
Prerequisites
Prerequisite is an introductory statistics and statistical inference course like “Statistical Tools for Decision Making” of the B. A. in Global Governance. Also some math is essential, but only few derivations are made.
Programma
Tema 1: Introduzione al Software R
Tema 2: Regressione Lineare
Tema 3: Regressione Logistica
Tema 4: Analisi delle Componenti Principali
Tema 5: Analisi di Cluster
Tema 6: Metodi di Apprendimento Automatico per l'Apprendimento Supervisionato
Tema 7: Applicazioni Moderne: Estrazione di Testo, Elaborazione delle Immagini
Program
Topic 1: Introduction to R Software
Topic 2: Linear Regression
Topic 3: Logistic Regression
Topic 4: Principal Component Analysis
Topic 5: Cluster Analysis
Topic 6: Machine Learning Methods for Supervised Learning
Topic 7: Modern Applications: Text Mining, Image Processing
Testi Adottati
Materiale di lettura su ciascun argomento del corso (dispense, diapositive, set di dati, script in R) sarà reso disponibile agli studenti dai docenti del corso durante lo svolgimento delle lezioni.
Books
Reading material on each course topic (handouts, slides, data sets, R scripts), will be made available to
the students by the course instructors during the course.
Bibliografia
Witten J.D., Hastie T., Tibshirani R. (2014). An Introduction to Statistical Learning with Applications
in R. Springer, Springer Series in Statistics
Chatfield, C. and Collins, A. J. (1981) Introduction to Multivariate Analysis, Chapman & Hall/CRC
Press
Everitt, B. S. and Hothorn, T. (2006) A Handbook of Statistical Analyses Using R. CRC Press.
Available for free at:http://www.ecostat.unical.it/tarsitano/Didattica/LabStat2/Everitt.pdf
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning: Data Mining,
Inference, and Prediction, Second Edition. Springer, Springer Series in Statistics. Available for
free at: https://web.stanford.edu/~hastie/ElemStatLearn/
Bibliography
Witten J.D., Hastie T., Tibshirani R. (2014). An Introduction to Statistical Learning with Applications
in R. Springer, Springer Series in Statistics
Chatfield, C. and Collins, A. J. (1981) Introduction to Multivariate Analysis, Chapman & Hall/CRC
Press
Everitt, B. S. and Hothorn, T. (2006) A Handbook of Statistical Analyses Using R. CRC Press.
Available for free at:http://www.ecostat.unical.it/tarsitano/Didattica/LabStat2/Everitt.pdf
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning: Data Mining,
Inference, and Prediction, Second Edition. Springer, Springer Series in Statistics. Available for
free at: https://web.stanford.edu/~hastie/ElemStatLearn/
Modalità di svolgimento
In presenza
Teaching methods
In-class teaching
Regolamento Esame
Gli studenti frequentanti verranno valutati tramite un esame scritto. Questo comprenderà domande a risposta chiusa e domande aperte. Sarà inoltre previsto un esame scritto a metà corso.
Gli studenti non frequentanti dovranno sostenere una prova orale oltre all'esame scritto.
i fini della valutazione, si utilizzerà lo schema che segue:
Non idoneo: importanti carenze e/o inaccuratezze nella conoscenza e comprensione degli argomenti; limitate capacità di analisi e sintesi, frequenti generalizzazioni e limitate capacità critiche e di giudizio, gli argomenti sono esposti in modo non coerente e con linguaggio inappropriato;
18-20: conoscenza e comprensione degli argomenti appena sufficiente con possibili generalizzazioni e imperfezioni; capacità di analisi sintesi e autonomia di giudizio sufficienti, gli argomenti sono esposti in modo frequentemente poco coerente e con un linguaggio poco appropriato/tecnico;
21-23: Conoscenza e comprensione degli argomenti routinaria; Capacità di analisi e sintesi corrette con argomentazione logica sufficientemente coerente e linguaggio appropriato/tecnico
24-26: Discreta conoscenza e comprensione degli argomenti; buone capacità di analisi e sintesi con argomentazioni espresse in modo rigoroso ma con un linguaggio non sempre appropriato/tecnico.
27-29: Conoscenza e comprensione degli argomenti completa; notevoli capacità di analisi e sintesi. Buona autonomia di giudizio. Argomenti esposti in modo rigoroso e con linguaggio appropriato/tecnico
30-30L: Ottimo livello di conoscenza e comprensione approfondita degli argomenti. Ottime capacità di analisi, di sintesi e di autonomia di giudizio. Argomentazioni espresse in modo originale e con linguaggio tecnico appropriato.
Exam Rules
Assessment for attending students will be based on a written exam. This will include closed and open questions. A midterm written exam will be held.
Non attending students will have to take an oral examination in addition to the written exam.
For assessment purposes, the following scheme will be used:
Unsuitable: major deficiencies and/or inaccuracies in the knowledge and understanding of the topics; limited capacity for analysis and synthesis, frequent generalisations and limited critical and judgmental skills, the topics are set out inconsistently and with inappropriate language;
18-20: barely sufficient knowledge and understanding of the topics with possible generalisations and imperfections; sufficient capacity for analysis synthesis and autonomy of judgement, the topics are frequently exposed in an incoherent way and with inappropriate/technical language;
21-23: Routine knowledge and understanding of topics; ability to analyse and synthesise correctly with sufficiently coherent logical argumentation and appropriate/technical language
24-26: Fair knowledge and understanding of the topics; Good analytical and synthetic skills with arguments expressed in a rigorous manner but with language that is not always appropriate/technical.
27-29: Comprehensive knowledge and understanding of the topics; considerable capacity for analysis and synthesis. Good autonomy of judgement. Arguments presented in a rigorous manner and with appropriate/technical language
30-30L: Excellent level of knowledge and thorough understanding of topics. Excellent analytical and synthetic skills and independent judgement. Arguments expressed in an original manner and with appropriate technical language.
MARCO STEFANUCCI
Prerequisiti
Nessun prerequisito formale
Prerequisites
No formal pre-requisites
Programma
Il programma del corso è suddiviso in due moduli collegati tra loro:
1. Definizione della salute e indicatori sanitari
• Definizioni di salute, indicatori di salute e determinanti demografici principali.
2. Storia naturale delle malattie acute e croniche
• Differenze principali tra malattie trasmissibili/infezioni e malattie non trasmissibili/non infettive (cause, tendenze, conseguenze).
3. Concetto di causa nelle scienze mediche
• Cause, fattori di rischio e determinanti della salute/malattia (stili di vita, educazione, disuguaglianze, isolamento sociale, ecc.).
4. Transizione demografica ed epidemiologica
• Sfide e opportunità poste dal nuovo scenario (aumento dell’aspettativa di vita, disabilità, migrazioni, ecc.).
5. Salute Globale
• Sfide poste dal crescente carico delle malattie croniche sui sistemi sanitari e dalle nuove e vecchie malattie infettive (HIV/AIDS, tubercolosi, malaria, SARS-CoV-2 e future pandemie); la necessità improrogabile di un approccio globale e planetario.
6. Salute ed economia
• La necessità di misurare la salute (DALY, QALY, Global Burden of Disease, ecc.).
7. Promozione e protezione della salute
• Impatto delle politiche pubbliche sulla salute; un approccio interdisciplinare.
8. Valutazione economica in sanità
• Preparazione alle epidemie e problemi economici: ruolo dell’OMS e altre istituzioni nazionali e internazionali nella gestione delle pandemie; best practices e lezioni apprese dalle pandemie (HIV/AIDS, Ebola, SARS-CoV-I e II).
9. Guerra e salute
• Impatto della guerra sulla salute, prevenzione e contenimento.
Program
The course is divided into two interconnected modules:
1. Definition of Health and Health Indicators
• Definitions of health, health indicators, and main demographic determinants.
2. Natural History of Acute and Chronic Diseases
• Main differences between communicable/infectious and non-communicable/non-infectious diseases (causes, trends, consequences).
3. The Concept of Cause in Medical Sciences
• Causes, risk factors, and health/disease determinants (lifestyles, education, inequalities, social isolation, etc.).
4. Demographic and Epidemiological Transition
• Challenges and opportunities posed by the new scenario (enhanced lifespan, disabilities, migrations, etc.).
5. Global Health
• Challenges posed by the increasing burden of chronic diseases on healthcare systems and new challenges from both new and old infectious diseases (HIV/AIDS, tuberculosis, malaria, SARS-CoV-2 and future pandemics); the urgent need for a global and planetary approach.
6. Health and Economics
• The need for measuring health (DALY, QALY, Global Burden of Disease, etc.).
7. Health Promotion and Protection
• Impact of public policies on health; an interdisciplinary approach.
8. Economic Evaluation in Health
• Preparedness for epidemics and economic issues: the role of WHO and other national and international institutions in managing pandemic diseases; best practices and lessons learned from pandemics (HIV/AIDS, Ebola, SARS-CoV-I and II).
9. Warfare and Health
• Health impact of war, prevention, and containment.
Testi Adottati
Studenti frequentanti:
1. Slides del corso.
2. Materiale distribuito dai docenti.
Studenti non frequentanti (frequenza inferiore all'80%):
Gli studenti non frquentanti studieranno UNO dei seguenti libri di testo:
Books
Attending students:
1. Slides of the course.
2. Reading material distributed by the lecturers
Non attending students (below 80% attendance): will study ONE of the following textbooks:
Bibliografia
Bibliografia di riferimento per studenti frequentanti:
• OECD, (2019), Health at a Glance 2019: OECD Indicators, OECD Publishing, Parigi, https://doi.org/10.1787/4dd50c09-en.
• World Health Statistics 2020: monitoring health for the SDGs, sustainable development goals. Ginevra: Organizzazione Mondiale della Sanità; 2020. Licenza: CC BY-NC-SA 3.0 IGO.
• The World Health Report 2013: Research for Universal Health Coverage. OMS, 2013.
• Guinness, L., Wiseman, V., Introduction to Health Economics – Understanding Public Health, McGraw Hill, Open University Press, seconda edizione, 2011.
Bibliografia di riferimento per studenti non frequentanti:
• Routledge Handbook of Global Public Health, 1ª edizione.
• Guest, C., Ricciardi, W., Oxford Handbook of Public Health Practice.
Materiali aggiuntivi:
• Letture obbligatorie, dispense del docente, letture da fonti web come www.who.int, www.euro.who.int, www.worldbank.org, ecc.
Bibliography
Main referral readings for attending students:
• OECD, (2019), Health at a Glance 2019: OECD Indicators, OECD Publishing, Paris, https://doi.org/10.1787/4dd50c09-en.
• World Health Statistics 2020: Monitoring Health for the SDGs, Sustainable Development Goals. Geneva: World Health Organization; 2020. Licence: CC BY-NC-SA 3.0 IGO.
• The World Health Report 2013: Research for Universal Health Coverage. WHO, 2013.
• Guinness, L., Wiseman, V., Introduction to Health Economics – Understanding Public Health, McGraw Hill, Open University Press, second edition, 2011.
Main referral readings for non-attending students:
• Routledge Handbook of Global Public Health, 1st Edition.
• Guest, C., Ricciardi, W., Oxford Handbook of Public Health Practice.
Additional materials:
• Required readings, handouts from the teacher, readings from online sources such as www.who.int, www.euro.who.int, www.worldbank.org, etc.
Modalità di svolgimento
Il corso combina diversi metodi di insegnamento: lezioni, seminari e presentazioni degli studenti. Le lezioni frontali forniranno agli studenti le informazioni necessarie e le indicazioni di lettura sui fenomeni oggetto di studio, mentre i seminari vedranno gli studenti confrontarsi criticamente con queste conoscenze e incoraggiare/partecipare ai dibattiti in classe. Gli studenti sono tenuti a frequentare ogni lezione, a venire in classe preparati e a partecipare alle discussioni.
Gli studenti concorderanno l'argomento delle loro presentazioni con i docenti e faranno delle presentazioni in Power-point valutate in cui valuteranno criticamente il contenuto e l'argomentazione di un argomento scelto e introdurranno domande correlate per la discussione in classe.
Teaching methods
The course combines different teaching methods: lectures; seminars; student presentations. The lectures will provide the students with the necessary information and reading guidelines on the phenomena under study, while seminars will see students critically engage with this knowledge and encourage/participate in class debates. Students are expected to attend each class, to come to class prepared and to participate in discussions.
Students will agree the topic of their presentations with the lecturers and give assessed Power-point presentations in which they will critically evaluate the content and argument of a chosen topic and introduce related questions for the class discussion.
Regolamento Esame
Verifica dell'apprendimento
La verifica (predefinita) dell'apprendimento avviene esclusivamente attraverso un esame finale che consiste in una presentazione individuale o di gruppo, come illustrato di seguito.
L'obiettivo dell'esame finale è verificare il raggiungimento dei risultati di apprendimento del corso. In particolare, l'esame valuta la preparazione complessiva dello studente, la capacità di integrare le conoscenze delle diverse parti del programma, la consequenzialità del ragionamento, la capacità di analisi e l'autonomia di giudizio. Inoltre, vengono valutate la proprietà di linguaggio e la chiarezza espositiva, in conformità con i descrittori di Dublino.
Punteggio minimo per il superamento della prova scritta 18 su 30.
Dopo aver ascoltato le presentazioni, i docenti comunicano i risultati agli studenti iscritti all'esame tramite il sistema Delphi.
Gli studenti possono sostenere l'esame in tutte le date disponibili. non è previsto il salto d'appello. L'esame sarà valutato secondo i seguenti criteri:
- FAIL: importanti carenze e/o imprecisioni nella conoscenza e comprensione degli argomenti; limitata capacità di analisi e sintesi, frequenti generalizzazioni e limitate capacità critiche e di giudizio, gli argomenti sono esposti in modo incoerente e con un linguaggio inappropriato;
- 18-20: Conoscenza e comprensione appena sufficiente degli argomenti con possibili generalizzazioni e imperfezioni; sufficiente capacità di analisi, sintesi e autonomia di giudizio, gli argomenti sono frequentemente esposti in modo incoerente e con linguaggio inappropriato/tecnico;
- 21-23: Conoscenza e comprensione ordinaria degli argomenti; capacità di analisi e sintesi corretta con argomentazione logica sufficientemente coerente e linguaggio appropriato/tecnico.
- 24-26: Discreta conoscenza e comprensione degli argomenti; buone capacità di analisi e sintesi con argomentazioni espresse in modo rigoroso ma con un linguaggio non sempre appropriato/tecnico.
- 27-29: Conoscenza e comprensione completa degli argomenti; notevole capacità di analisi e sintesi. Buona autonomia di giudizio. Argomentazioni presentate in modo rigoroso e con un linguaggio appropriato/tecnico.
- 30-30L: Ottimo livello di conoscenza e comprensione approfondita degli argomenti. Ottime capacità di analisi e sintesi e autonomia di giudizio. Argomenti espressi in modo originale e con linguaggio tecnico appropriato.
Valutazione del corso per gli studenti frequentanti:
Valutazione del corso per gli studenti non frequentanti:
Exam Rules
Course assessment
The (default )verification of learning takes place exclusively through a final examination which consists of an individual or group presentation as discussed below. The objective of the final examination is to verify the achievement of the course learning outcome. In particular, the examination assesses the student's overall preparation, ability to integrate knowledge of the different parts of the programme, consequentiality of reasoning, analytical ability and autonomy of judgement. In addition, ownership of language and clarity of exposition are assessed, in adherence with the Dublin descriptors.
Minimum score for passing the written test 18 out of 30.
After listening to the presentations, the lecturers communicate the results to the students registered for the examination via the Delphi system.
Students may take the examination on all available dates. there is no roll-call jump.
The examination will be assessed according to the following criteria:
• FAIL: important deficiencies and/or inaccuracies in the knowledge and understanding of the topics; limited ability to analyse and synthesise, frequent generalisations and limited critical and judgemental skills, the topics are set out inconsistently and with inappropriate language;
• 18-20: Barely sufficient knowledge and understanding of the topics with possible generalisations and imperfections; sufficient capacity for analysis, synthesis and autonomy of judgement, the topics are frequently exposed in an incoherent manner and with inappropriate/technical language;
• 21-23: Routine knowledge and understanding of topics; ability to analyse and synthesise correctly with sufficiently coherent logical argumentation and appropriate/technical language
• 24-26: Fair knowledge and understanding of the topics; Good analytical and synthetic skills with arguments expressed in a rigorous manner but with language that is not always appropriate/technical.
• 27-29: Comprehensive knowledge and understanding of the topics; considerable capacity for analysis and synthesis. Good autonomy of judgement. Arguments presented in a rigorous manner and with appropriate/technical language
• 30-30L: Excellent level of knowledge and thorough understanding of topics. Excellent analytical and synthetic skills and independent judgement. Arguments expressed in an original manner and with appropriate technical language.
Course evaluation for attending students:
• In-class presentations (100 %)
• Rules for the presentation: Students can work on their presentations alone or in groups. A group may comprise 2 to 4 students. The students agree on the topic of the presentations with the lecturers, individually or in groups. Each student/group prepares its presentation and emails it to the lecturers at least one day in advance of the day scheduled for class discussion. In the case of group presentations, each group member receives the same final grade.
Course evaluation for non-attending students:
• Final oral exam (100%).
• Rules for the oral exam: the final exam consists of an approximately 20-minute oral test with questions on one of the textbooks indicated above,
EN
IT
Obiettivi Formativi
Il corso copre alcune tecniche statistiche per l'apprendimento supervisionato e non supervisionato, oltre ad alcuni metodi per l'apprendimento automatico. Il software R per il calcolo statistico sarà anche introdotto e utilizzato in tutto il mondo.
Le tecniche di apprendimento supervisionato vengono utilizzate per prevedere una variabile obiettivo (regressione lineare e logistica, alberi di classificazione e foreste casuali) in base a predittori e / o per valutare le interrelazioni tra predittori e una variabile obiettivo (regressione lineare e logistica). Ad esempio, supponi di voler prevedere il rischio che una famiglia venga materialmente privata l'anno prossimo. Ciò può essere fatto utilizzando dati che possono essere misurati al basale (numero di membri della famiglia, reddito disponibile, stato di salute, ecc.) E utilizzarli per prevedere la deprivazione materiale per un campione di famiglie con stato noto. Per inciso, capirai anche come lo stato di salute influisce sul rischio di deprivazione materiale.
Le tecniche di apprendimento senza supervisione vengono utilizzate per trovare gruppi nei dati, ovvero per prevedere le variabili categoriali target che non vengono misurate (analisi dei cluster). Inoltre, vengono utilizzati per riepilogare i dati (riduzione delle dimensioni, eseguita con l'analisi delle componenti principali in questo corso). Ad esempio, supponi di voler valutare un tratto non misurabile, come la felicità. Supponi che le tue unità di destinazione siano regioni geografiche. La felicità può essere misurata indirettamente attraverso una serie di variabili (questionari, indici, ecc.). Un punteggio generale si ottiene attraverso la riduzione delle dimensioni trovando la media ponderata ottimale di tutte le misurazioni. L'analisi dei cluster separerà le regioni in pochi (due, tre, quattro) gruppi, rispetto ai livelli di felicità. È quindi possibile pianificare diverse politiche per ogni gruppo.
Gli ultimi 3 CFU saranno dedicati ai metodi di machine learning (alberi di classificazione e regressione, foreste casuali, reti neurali superficiali e profonde) per
apprendimento supervisionato. Verranno quindi introdotte applicazioni moderne, dove i dati vengono estratti da corpora di testo (elaborazione in linguaggio naturale), immagini (visione artificiale), tracce audio.
Gli obiettivi principali di questo corso sono fornire agli studenti la capacità di selezionare la tecnica di apprendimento statistico necessaria per rispondere a domande specifiche (sulla base dei dati), per eseguire l'analisi dei dati in modo appropriato e per interpretare correttamente i risultati.
Learning Objectives
The course covers some statistical techniques for supervised and unsupervised learning, plus some methods for machine learning. The R software for statistical computing will be also introduced and used throughout.
Supervised learning techniques are used to predict a target variable (linear and logistic regression, classification trees, and random forests) based on predictors, and/or to assess interrelationships among predictors and a target variable (linear and logistic regression). As an example, suppose you want to predict the risk that a family will be materially deprived next year. This can be done by using data that can be measured at baseline (number of family members, disposable income, health status, etc.) and use these to predict material deprivation for a sample of families with known status. Incidentally, you will also understand how health status affects the risk of material deprivation.
Unsupervised learning techniques are used to find groups in data, that is, to predict target categorical variables that are not measured (cluster analysis). Additionally, they are used to summarize data (dimension reduction, done with principal component analysis in this course). As an example, suppose you want to assess an unmeasurable trait, like happiness. Suppose your target units are geographic regions. Happiness can be measured indirectly through a series of variables (questionnaires, indices, etc.). A general score is obtained through dimension reduction by finding the optimal weighted average of all measurements. Cluster analysis will separate regions in few (two, three, four) groups, with respect to levels of happiness. Different policies can then be scheduled for each group.
The last 3 CFU will be dedicated to machine learning methods (classification and regression trees, random forests, shallow and deep neural networks) for
supervised learning. Modern applications will be then introduced, where data is extracted from text corpora (natural language processing), images (computer vision), audio tracks.
The main objectives of this course are to provide students with the ability to select the statistical learning technique needed to answer specific questions (based on data), to perform data analysis appropriately, and to interpret the results correctly.
ALESSIO FARCOMENI
Prerequisiti
Il requisito è un corso introduttivo di statistica e inferenza statistica come "Strumenti Statistici per la Presa di Decisioni" del corso di laurea in Governance Globale. È inoltre necessaria una certa conoscenza di matematica, anche se vengono effettuate solo poche derivate.
Prerequisites
-Prerequisite is an introductory statistics and statistical inference course like “Statistical Tools for Decision Making” of the B. A. in Global Governance. Also some math is essential, but only few derivations are made.
Programma
Tema 1: Introduzione al Software R
Tema 2: Regressione Lineare
Tema 3: Regressione Logistica
Tema 4: Analisi delle Componenti Principali
Tema 5: Analisi di Cluster
Tema 6: Metodi di Apprendimento Automatico per l'Apprendimento Supervisionato
Tema 7: Applicazioni Moderne: Estrazione di Testo, Elaborazione delle Immagini
Program
Topic 1: Introduction to R Software
Topic 2: Linear Regression
Topic 3: Logistic Regression
Topic 4: Principal Component Analysis
Topic 5: Cluster Analysis
Topic 6: Machine Learning Methods for Supervised Learning
Topic 7: Modern Applications: Text Mining, Image Processing
Testi Adottati
Materiale di lettura su ciascun argomento del corso (dispense, diapositive, set di dati, script in R) sarà reso disponibile agli studenti dai docenti del corso durante lo svolgimento delle lezioni.
Books
Reading material on each course topic (handouts, slides, data sets, R scripts), will be made available to
the students by the course instructors during the course.
Bibliografia
Witten J.D., Hastie T., Tibshirani R. (2014). An Introduction to Statistical Learning with Applications
in R. Springer, Springer Series in Statistics
Chatfield, C. and Collins, A. J. (1981) Introduction to Multivariate Analysis, Chapman & Hall/CRC
Press
Everitt, B. S. and Hothorn, T. (2006) A Handbook of Statistical Analyses Using R. CRC Press.
Available for free at:http://www.ecostat.unical.it/tarsitano/Didattica/LabStat2/Everitt.pdf
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning: Data Mining,
Inference, and Prediction, Second Edition. Springer, Springer Series in Statistics. Available for
free at: https://web.stanford.edu/~hastie/ElemStatLearn/
Bibliography
Witten J.D., Hastie T., Tibshirani R. (2014). An Introduction to Statistical Learning with Applications
in R. Springer, Springer Series in Statistics
Chatfield, C. and Collins, A. J. (1981) Introduction to Multivariate Analysis, Chapman & Hall/CRC
Press
Everitt, B. S. and Hothorn, T. (2006) A Handbook of Statistical Analyses Using R. CRC Press.
Available for free at:http://www.ecostat.unical.it/tarsitano/Didattica/LabStat2/Everitt.pdf
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning: Data Mining,
Inference, and Prediction, Second Edition. Springer, Springer Series in Statistics. Available for
free at: https://web.stanford.edu/~hastie/ElemStatLearn/
Modalità di svolgimento
In presenza.
Teaching methods
In-class teaching.
Regolamento Esame
Gli studenti frequentanti verranno valutati tramite un esame scritto. Questo comprenderà domande a risposta chiusa e domande aperte. Sarà inoltre previsto un esame scritto a metà corso.
Gli studenti non frequentanti dovranno sostenere una prova orale oltre all'esame scritto
Exam Rules
Assessment for attending students will be based on a written exam. This will include closed and open questions. A midterm written exam will be held.
Non attending students will have to take an oral examination in addition to the written exam.
MARCO STEFANUCCI
Prerequisites
Prerequisite is an introductory statistics and statistical inference course like “Statistical Tools for Decision Making” of the B. A. in Global Governance. Also some math is essential, but only few derivations are made.
Books
Reading material on each course topic (handouts, slides, data sets, R scripts), will be made available to the students by the course instructors during the course.
Regolamento Esame
Gli studenti frequentanti verranno valutati tramite un esame scritto. Questo comprenderà domande a risposta chiusa e domande aperte. Sarà inoltre previsto un esame scritto a metà corso.
Gli studenti non frequentanti dovranno sostenere una prova orale oltre all'esame scritto.
Aggiornato A.A. 2019-2020
Aggiornato A.A. 2019-2020
Course Description
The course covers some statistical techniques for supervised and unsupervised learning. The R software for statistical computing will be also introduced and used throughout.
Supervised learning techniques are used to predict a target variable (linear and logistic regression, classification trees, and random forests) based on predictors, and/or to assess interrelationships among predictors and a target variable (linear and logistic regression). As an example, suppose you want to predict the risk that a family will be materially deprived next year. This can be done by using data that can be measured at baseline (number of family members, disposable income, health status, etc.) and use these to predict material deprivation for a sample of families with known status. Incidentally, you will also understand how health status affects the risk of material deprivation.
Unsupervised learning techniques are used to find groups in data, that is, to predict target categorical variables that are not measured (cluster analysis). Additionally, they are used to summarize data (dimension reduction, done with principal component analysis in this course). As an example, suppose you want to assess an unmeasurable trait, like happiness. Suppose your target units are geographic regions. Happiness can be measured indirectly through a series of variables (questionnaires, indices, etc.). A general score is obtained through dimension reduction by finding the optimal weighted average of all measurements. Cluster analysis will separate regions in few (two, three, four) groups, with respect to levels of happiness. Different policies can then be scheduled for each group.
The main objectives of this course are to provide students with the ability to select the statistical learning technique needed to answer specific questions (based on data), to perform data analysis appropriately, and to interpret the results correctly.
For more details refer to the complete syllabus.
Prerequisites
Prerequisite is an introductory statistics and statistical inference course like “Statistical Tools for Decision Making” of the B. A. in Global Governance. Also some math is essential, but only few derivations are made.
Teaching Method
The course is carried out through lectures and practicums. Techniques will be introduced by examples and described in mathematical formulas. Focus will be on the practical implementation of each technique, and interpretation of results. As many classes as possible will be held in the computer lab, where in the final part of the lesson students will be able to practice the newly introduced topics.
Topics
Introduction to R software (taught by Prof. Guardabascio), Linear regression (taught by Prof. Guardabascio), Logistic regression, Classification trees and random forests, Cluster analysis, Principal component analysis
Textbook and Materials
Reading material on each course topic (handouts, slides, data sets, R scripts), will be made available to the students by the course instructors during the course.
Suggested books are:
Witten J.D., Hastie T., Tibshirani R. (2014). An Introduction to Statistical Learning with Applications in R. Springer, Springer Series in Statistics
Chatfield, C. and Collins, A. J. (1981) Introduction to Multivariate Analysis, Chapman & Hall/CRC Press
Assessment
Assessment will be carried out through a written exam and practicum.
An additional oral discussion will be held for non-attending students.