![]() | Programme d’études 2025-2026 | English | |
![]() | Bio-informatique et sciences des données II | ||
Unité d’enseignement du programme de Bachelier en sciences biologiques (CHARLEROI) (Horaire jour) à la Faculté des Sciences |
| Code | Type | Responsable | Coordonnées du service | Enseignant(s) |
|---|---|---|---|---|
| US-B3-SCBIOC-940-C | UE Obligatoire | CONOTTE Raphael | S819 - FS - Service Décanat-Site CHRL (Charleroi) |
|
| Langue d’enseignement | Langue d’évaluation | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Crédits | Pondération | Période d’enseignement |
|---|---|---|---|---|---|---|---|---|---|
| Français | 0 | 60 | 0 | 0 | 0 | 5 | 5.00 | Année |
| Code(s) d’AA | Activité(s) d’apprentissage (AA) | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Période d’enseignement | Pondération |
|---|---|---|---|---|---|---|---|---|
| S-BIOG-937 | Sciences des données - Modélisation | 0 | 25 | 0 | 0 | 0 | Q1 | |
| S-BIOG-958 | Sciences des données - Analyses multivariées | 0 | 20 | 0 | 0 | 0 | Q2 | |
| S-BIOG-959 | Bioinformatique | 0 | 15 | 0 | 0 | 0 | Q2 |
| Unité d'enseignement | ||
|---|---|---|
![]() | US-B2-SCBIOC-926-C Bio-informatique et sciences des données I | |
Objectifs par rapport aux acquis d'apprentissage du programme
Acquis d'apprentissage de l'UE
- Appliquer de manière appropriée des méthodes statistiques à des données biologiques hétérogènes, en mobilisant des modèles linéaires (simples, généralisés, non linéaires), des techniques d’ordination (ACP, AFC) et des méthodes de classification (telles que les dendrogrammes).
- Décrire précisément les caractéristiques des jeux de données, évaluer la validité des hypothèses sous-jacentes aux méthodes choisies, et ajuster les analyses en fonction de la nature des variables et de la structure des données.
- Interpréter les résultats statistiques de façon critique et rigoureuse, en formulant des conclusions claires, cohérentes avec les objectifs expérimentaux.
- Développer une première maîtrise des outils de bioinformatique pour l’analyse de données issues de la génomique, notamment à travers l’utilisation de l’écosystème Bioconductor.
Contenu de l'UE : descriptif et cohérence pédagogique
Cette unité aborde les méthodes statistiques avancées et les outils bioinformatiques pour l’analyse de données biologiques. Elle est structurée selon les axes suivants :
1. Modélisation statistique
- Modèles linéaires avec variables prédictives qualitatives et quantitatives
- Modèles linéaires généralisés (GLM)
- Modèles non linéaires
2. Analyse multivariée et classification
- Analyse en composantes principales (ACP), analyse factorielle des correspondances (AFC), analyse factorielle multiple (AFM)
- Distances et classification hiérarchique (CAH)
- Méthodes de regroupement : k-means et cartes auto-organisatrices (SOM)
3. Bioinformatique et analyse de données génomiques
- Introduction à l’écosystème Bioconductor
- Assemblage et annotation de données transcriptomiques
- Analyse RNA-Seq : prétraitement, normalisation, expression différentielle
Compétences préalables
Bases en science des données, en particulier :
- Gestion de projets d'analyse des données
- Importation, nettoyage et transformation des données
- Visualisation des données à l'aide de graphiques variés
- Rédaction de rapports reproductibles
- Analyse statistique de base, couvrant les statistiques univariées et bivariée
Type(s) et mode(s) d'évaluation Q1 pour l'UE
Commentaire sur les évaluations Q1 de l'UE
Note finale basée sur les évaluations suivantes :
1. Évaluation de la progression continue :
- Tutoriel interactif (learnr) : Suivi des progrès à travers un tutoriel en ligne interactif, permettant de se familiariser avec le code tout en acquérant les compétences nécessaires. Le tutoriel fournit également un feedback instantané sur les exercices réalisés, facilitant ainsi l'apprentissage.
- Réalisation de travaux pratiques : Évaluations basées sur des travaux pratiques, à la fois guidés et libres, effectués individuellement ou en groupe. Ces travaux permettent d'appliquer les concepts abordés en cours dans des situations concrètes.
- Plusieurs tests en ligne : Des tests en ligne réguliers évaluent la compréhension théorique et les connaissances pratiques acquises tout au long du cours.
2. Examen final :
- Projet libre ou reproduction de figures et tableaux : L'examen final se présente sous la forme d'un projet où l'étudiant doit appliquer les outils et concepts vus durant le cours. Cela peut inclure la création de figures, la reproduction de tableaux ou l'analyse de données à l’aide des techniques enseignées.
- Test en ligne de compréhension et de connaissances : Un test en ligne complémentaire permettra d'évaluer la maîtrise des concepts clés, de la méthodologie et des techniques abordées dans le cours.
En raison de l'évaluation continue, la présence aux séances est obligatoire pour garantir un suivi adéquat des progrès.
Méthode de calcul de la note globale pour l'évaluation Q1 de l'UE
(Q1) Sciences des données : Modélisation ; 40 % de la note finale de l’UE
(Q2) Sciences des données : Analyses multivariées ; 40 % de la note finale de l’UE
(Q2) Bioinformatique ; 20 % de la note finale de l’UE
Chaque activité d’apprentissage (AA) doit être réussie individuellement. En cas de note inférieure à 10/20 pour une ou plusieurs AA, la note finale de l’UE sera celle de l’AA en échec ayant obtenu la note la plus basse, indépendamment de la moyenne pondérée.
Si la moyenne de l’UE est inférieure à 10/20, seules les AA non réussies devront être représentées lors de la session suivante.
Type(s) et mode(s) d'évaluation rattrapage Q1 (BAB1) pour l'UE
Commentaire sur les évaluations rattrapage Q1 (BAB1) de l'UE
Sans objet
Méthode de calcul de la note globale pour l'évaluation rattrapage Q1 (BAB1) de l'UE
Néant
Type(s) et mode(s) d'évaluations Q2 pour l'UE
Commentaire sur les évaluations Q2 de l'UE
Note finale basée sur les évaluations suivantes :
1. Évaluation de la progression continue :
- Tutoriel interactif (learnr) : Suivi des progrès à travers un tutoriel en ligne interactif, permettant de se familiariser avec le code tout en acquérant les compétences nécessaires. Le tutoriel fournit également un feedback instantané sur les exercices réalisés, facilitant ainsi l'apprentissage.
- Réalisation de travaux pratiques : Évaluations basées sur des travaux pratiques, à la fois guidés et libres, effectués individuellement ou en groupe. Ces travaux permettent d'appliquer les concepts abordés en cours dans des situations concrètes.
- Plusieurs tests en ligne : Des tests en ligne réguliers évaluent la compréhension théorique et les connaissances pratiques acquises tout au long du cours.
2. Examen final :
- Projet libre ou reproduction de figures et tableaux : L'examen final se présente sous la forme d'un projet où l'étudiant doit appliquer les outils et concepts vus durant le cours. Cela peut inclure la création de figures, la reproduction de tableaux ou l'analyse de données à l’aide des techniques enseignées.
- Test en ligne de compréhension et de connaissances : Un test en ligne complémentaire permettra d'évaluer la maîtrise des concepts clés, de la méthodologie et des techniques abordées dans le cours.
En raison de l'évaluation continue, la présence aux séances est obligatoire pour garantir un suivi adéquat des progrès.
Méthode de calcul de la note globale pour l'évaluation Q2 de l'UE
(Q1) Sciences des données : Modélisation ; 40 % de la note finale de l’UE
(Q2) Sciences des données : Analyses multivariées ; 40 % de la note finale de l’UE
(Q2) Bioinformatique ; 20 % de la note finale de l’UE
Chaque activité d’apprentissage (AA) doit être réussie individuellement. En cas de note inférieure à 10/20 pour une ou plusieurs AA, la note finale de l’UE sera celle de l’AA en échec ayant obtenu la note la plus basse, indépendamment de la moyenne pondérée.
Si la moyenne de l’UE est inférieure à 10/20, seules les AA non réussies devront être représentées lors de la session suivante.
Type(s) et mode(s) d'évaluations Q3 pour l'UE
Commentaire sur les évaluations Q3 de l'UE
- Partie pratique : cette partie consiste en un projet où l'étudiant applique les outils et concepts abordés tout au long du cours. Cela inclut la présentation des données sous forme de figures ou de tableaux, ainsi que l'analyse statistique à l'aide des techniques enseignées.
- Test en ligne de compréhension et de connaissances : Un test en ligne complémentaire permettra d'évaluer la maîtrise des concepts clés, de la méthodologie et des techniques abordées dans le cours.
Important : Les tutoriels interactifs (learnr) et les travaux pratiques guidés doivent être réalisés avant l'examen du Q3 si ceux-ci n'ont pas été faits durant les Q1 et Q2.
Méthode de calcul de la note globale pour l'évaluation Q3 de l'UE
(Q1) Sciences des données : Modélisation ; 40 % de la note finale de l’UE
(Q2) Sciences des données : Analyses multivariées ; 40 % de la note finale de l’UE
(Q2) Bioinformatique ; 20 % de la note finale de l’UE
Chaque activité d’apprentissage (AA) doit être réussie individuellement. Les notes obtenues pour les AAs réussies au Q1 ou au Q2 sont conservées pour la session du Q3.
En cas de note inférieure à 10/20 pour une ou plusieurs AA, la note finale de l’UE sera celle de l’AA en échec ayant obtenu la note la plus basse, indépendamment de la moyenne pondérée.
Types d'activités
| AA | Types d'activités |
|---|---|
| S-BIOG-937 |
|
| S-BIOG-958 |
|
| S-BIOG-959 |
|
Mode d'enseignement
| AA | Mode d'enseignement |
|---|---|
| S-BIOG-937 |
|
| S-BIOG-958 |
|
| S-BIOG-959 |
|
Supports principaux non reproductibles
| AA | Supports principaux non reproductibles |
|---|---|
| S-BIOG-937 | Sans objet |
| S-BIOG-958 | Sans objet |
| S-BIOG-959 | Sans objet |
Supports complémentaires non reproductibles
| AA | Support complémentaires non reproductibles |
|---|---|
| S-BIOG-937 | Sans objet |
| S-BIOG-958 | Sans objet |
| S-BIOG-959 | Sans objet |
Autres références conseillées
| AA | Autres références conseillées |
|---|---|
| S-BIOG-937 | Barnier, J., 2018. Introduction à R et au tidyverse (https://juba.github.io/tidyverse/index.html). Ismay, Ch. & Kim A.Y, 2018. Moderndive: An introduction to statistical and data science via R (http://moderndive.com). Wickham, H. & Grolemund, G, 2017. R for data science (http://r4ds.had.co.nz). Cornillon, P.A. Et al, 2008. Statistiques avec R. Presses Universitaires de Rennes. 257pp. Dagnelie, P., 2007. Statistique théorique et appliquée, Volumes I et II (2ème ed.). De Boeck & Larcier, Bruxelles. 511pp (vol. I) 734pp (vol. II). Zar, J.H., 2010. Biostatistical analysis (5th ed.). Pearson Education, London. 944pp. Venables W.N. & B.D. Ripley, 2002. Modern applied statistics with S-PLUS (4th ed.). Springer, New York, 495 pp. Legendre, P. & L. Legendre, 1998. Numerical ecology (2nd ed.). Springer Verlag, New York. 587 pp. |
| S-BIOG-958 | Barnier, J., 2018. Introduction à R et au tidyverse (https://juba.github.io/tidyverse/index.html). Ismay, Ch. & Kim A.Y, 2018. Moderndive: An introduction to statistical and data science via R (http://moderndive.com). Wickham, H. & Grolemund, G, 2017. R for data science (http://r4ds.had.co.nz). Cornillon, P.A. Et al, 2008. Statistiques avec R. Presses Universitaires de Rennes. 257pp. Dagnelie, P., 2007. Statistique théorique et appliquée, Volumes I et II (2ème ed.). De Boeck & Larcier, Bruxelles. 511pp (vol. I) 734pp (vol. II). Zar, J.H., 2010. Biostatistical analysis (5th ed.). Pearson Education, London. 944pp. Venables W.N. & B.D. Ripley, 2002. Modern applied statistics with S-PLUS (4th ed.). Springer, New York, 495 pp. Legendre, P. & L. Legendre, 1998. Numerical ecology (2nd ed.). Springer Verlag, New York. 587 pp. |
| S-BIOG-959 | Sans objet |