Anar al contingut (clic a Intro)
UdG Home UdG Home
Tancar
Menú

Estudia

Dades generals

Curs acadèmic:
2025
Descripció:
L'objectiu d'aquesta assignatura és revisar i comprendre els elements estadístics bàsics de la ciència de dades, així com introduir tècniques específiques que formen part del corpus de metodologies de la ciència de dades. 1. Exploració i visualització bàsica de dades. Eines computacionals. 2. Conceptes de probabilitat i inferència estadística. 3. Conceptes i tècniques per l'anàlisi de dades multivariants. 4. Modelització estadística: models lineals, no lineals, generalitzats. 5. Avaluació de models: ajust, capacitat predictiva, validació creuada
Crèdits:
6
Professor responsable:
Javier Palarea Albaladejo

Grups

Grup A

Durada:
Semestral, 1r semestre
Professorat:
Javier Palarea Albaladejo
Idioma de les classes:
Anglès (100%)

Competències

  • CB10 Que els estudiants tinguin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma
  • CE1 Programar a un nivell avançat en els llenguatges i llibreries més utilitzades en la ciència de dades
  • CE7 Entendre, desenvolupar, modificar i aplicar de manera efectiva mètodes d'aprenentatge automàtic
  • CE8 Quantificar la bondat dels resultats obtinguts mitjançant la tecnologia de la ciència de dades a través de mètriques adequades
  • CE12 Entendre i utilitzar els principals fonaments estadístics de les tècniques de ciència de dades
  • CE13 Entendre les dades a partir de visualitzacions adequades

Continguts

1. Overview of basic statistics and probability

          1.1. Getting started with R

          1.2. Basic concepts and data exploration

          1.3. Probability distributions

          1.4. Sampling, estimation and hypothesis testing

2. Introduction to multivariate data analysis

          2.1. Multivariate data

          2.2. Data reduction: principal components analysis and biplot

          2.3. Supervised classification: discriminant analysis

          2.4. Resampling and cross-validation

          2.5. Correspondence analysis of count data

          2.6. Low-dimensional visualisation: multidimensional scaling

3. Statistical modelling

          3.1. Linear and generalised linear regression

          3.2. Logistic regression for binary response

          3.3. Poisson regression for counts

          3.4. Additive models based on smooth splines

          3.5. Model assessment and simplification

          3.6. Regression analysis with many variables

Activitats

Tipus d’activitat Hores amb professor Hores sense professor Hores virtuals amb professor Total
Anàlisi / estudi de casos 9,00 31,50 0 40,50
Exposició dels estudiants 3,00 10,50 0 13,50
Sessió expositiva 24,00 30,00 0 54,00
Sessió pràctica 18,00 24,00 0 42,00
Total 54,00 96,00 0 150

Bibliografia

  • Faraway, J.J. (2016). Extending the Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models (Segona). Chapman and Hall/CRC.
  • Hastie, T., Tibshirani, R. and Friedman, J.H. (2016). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (Segona). Springer.
  • James, G., Witten, D., Hastie, T. and Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R (Segona). Springer.
  • Johnson, R.A., Wichern, D.W. (2007). Applied Multivariate Statistical Analysis (Sisena). Pearson Prentice Hall.
  • Schumacker, Randall E. (2016). Using R with multivariate statistics. Thousand Oaks, California: SAGE Publications, Inc.. Catàleg
  • Efron, B., Hastie, T. (2016). Computer Age Statistical Inference, Algorithms, Evidence, and Data Science. Cambridge University Press.

Avaluació i qualificació

Activitats d'avaluació:

Descripció de l'activitat Avaluació de l'activitat % Recuperable
Tasques d'aplicació de conceptes i mètodes bàsics d'anàlisi i modelització de dades associades al bloc 1 de l'assignatura Correcta utilització dels mètodes i models per a resoldre problemes aplicats. Correcta interpretació de resultats. 20 No
Tasques d'aplicació de conceptes i mètodes bàsics d'anàlisi i modelització de dades associades al bloc 2 de l'assignatura Correcta utilització dels mètodes i models per a resoldre problemes aplicats. Correcta interpretació de resultats. 30 No
Tasques d'aplicació de conceptes i mètodes bàsics d'anàlisi i modelització de dades associades al bloc 3 de l'assignatura Correcta utilització dels mètodes i models per a resoldre problemes aplicats. Correcta interpretació de resultats. 30 No
Presentació i discussió oral d'un tema estadístic en grup Qualitat, adequació i exactitud del contingut. Qualitat del material preparat i de l'exposició. Exactitud de les respostes a les preguntes que es puguin plantejar. 20 No

Qualificació

El professorat avaluarà sobre 10 cada una de les activitats d'avaluació proposades durant el desenvolupament de l'assignatura.

Criteris específics de la nota «No Presentat»:
No fer cap de les proves d'avaluació.

Avaluació única:
L'avaluació única de l'assignatura s'acordarà amb el professorat a principi de curs i consistirà en una prova en referència als diferents blocs de l'assignatura.

Requisits mínims per aprovar:
Per considerar superada l’assignatura, caldrà obtenir una qualificació mitjana mínima de 5.0.

Tutoria

L'alumnat podran sol·licitar fer tutories presencials o bé online amb Google Meet o equivalent. Les tutories podran ser individuals o amb grup.

Comunicació i interacció amb l'estudiantat

Tota la comunicació i avisos amb relació a l'assignatura es trobaran en el tauler d'avisos i notícies de l'assignatura al Moodle.

El professorat de l'assignatura es comunicarà amb l'alumnat a classe i mitjançant les vies habituals a través del Moodle de l'assignatura i/o a través del correu electrònic.

Observacions

S'ha d'instal·lar els programa R i RStudio a l'ordinador personal.
El programa R es pot descarregar gratuïtament des de https://www.r-project.org/
El programa RStudio es pot obtenir en https://www.rstudio.com/products/rstudio/download/

Les instruccions concretes perquè l'alumne instal·li i s'introdueixi a RStudio es facilitaran abans de l'inici del curs. L'ALUMNE HAURÀ DE FER AQUESTES TASQUES DE MANERA PERSONAL ABANS DE LA PRIMERA SESSIÓ.

Tota la documentació, comunicació i avisos amb relació a l'assignatura es trobaran en el Moodle de l'assignatura.

No està permès l’ús d’eines d’IA a les proves d'avaluació.

Escull quins tipus de galetes acceptes que el web de la Universitat de Girona pugui guardar en el teu navegador.

Les imprescindibles per facilitar la vostra connexió. No hi ha opció d'inhabilitar-les, atès que són les necessàries pel funcionament del lloc web.

Permeten recordar les vostres opcions (per exemple llengua o regió des de la qual accediu), per tal de proporcionar-vos serveis avançats.

Proporcionen informació estadística i permeten millorar els serveis. Utilitzem cookies de Google Analytics que podeu desactivar instal·lant-vos aquest plugin.

Per a oferir continguts publicitaris relacionats amb els interessos de l'usuari, bé directament, bé per mitjà de tercers (“adservers”). Cal activar-les si vols veure els vídeos de Youtube incrustats en el web de la Universitat de Girona.