![]() | Programme d’études 2025-2026 | English | |
| Introduction to Machine Learning and Data Science | |||
Activité d'apprentissage |
| Code | Titulaire(s) | Co-Titulaire(s) | Suppléant(s) et autre(s) | Établissement(s) |
|---|---|---|---|---|
| S-INFO-256 |
|
|
|
| Langue d’enseignement | Langue d’évaluation | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Période d’enseignement |
|---|---|---|---|---|---|---|---|
| Anglais, Français | Anglais, Français | 30 | 30 | 0 | 0 | 0 | Q2 |
Contenu de l'AA
Ce cours propose une introduction générale à l'apprentissage automatique/statistique. Les sujets abordés incluent :
- Bases : rappels de probabilités et statistiques, optimisation non linéaire (descente de gradient, méthode de Newton).
- Apprentissage supervisé (régression et classification) : erreurs d'entraînement et de test, exemples de modèles paramétriques et non paramétriques (régression polynomiale, k-nearest neighbors), évaluation et sélection de modèles, compromis biais/variance, underfitting et overfitting.
- Méthodes de rééchantillonnage : cross-validation, bootstrap.
- Modèles linéaires : régression linéaire et interprétation, sélection de sous-ensemble, méthodes de régularisation (ridge et LASSO).
- Classification : régression logistique, naive Bayes, analyse discriminante linéaire et quadratique.
- Modèles non linéaires : arbres de décision pour la régression, arbres de décision pour la classification (utilisant l'entropie et l’indice de Gini), réseaux de neurones.
- Apprentissage ensembliste : bagging, forêts aléatoires, boosting.
- Apprentissage non supervisé : réduction de dimension, analyse en composantes principales.
- D’autres sujets (par exemple, les machines à vecteurs de support ou le clustering) pourront être abordés en fonction du temps disponible.
Les travaux pratiques et le projet mobilisent les librairies classiques Python utilisées pour le calcul scientifique (numpy, pandas, scikit-learn, PyTorch).
Supports principaux non reproductibles
Les slides, notes de cours et séances d'exercices sont disponibles sur Moodle. Les supports de cours sont en anglais.
Support complémentaires non reproductibles
Sans objet
Autres références conseillées
- An Introduction to Statistical Learning: with Applications in Python. James, G., Witten, D., Hastie, T., Tibshirani, R., & Taylor, J. (2023). Springer.
- The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd edition). Hastie, T., Tibshirani, R., & Friedman, J. (2009). Springer.
- CS229: Machine Learning – Lecture Notes. Ng, A., & Ma, T. (2023). Stanford University.
- Introduction to Probability for Data Science. Chan, S. H. (2021). Michigan Publishing Services.
Mode d'enseignement
Types d'activités
Evaluations
Les modalités d'évaluation de l'AA sont précisées dans la fiche de l'UE dont elle dépend
Implantation(s) où l’activité d’apprentissage sera organisée
Implantation(s) où l’activité d’apprentissage sera évaluée