Parcours Modélisation et statistique pour la biologie

Conditions d’accès

Le parcours MSB est accessible aux étudiants titulaires d’un Master 1ère année en Mathématiques ou Mathématiques appliquées (ou diplôme étranger de niveau équivalent, ou dernière année de Grande Ecole d’Ingénieur). Un bon niveau en probabilités et statistique est requis.

Objectifs de la formation

L’objectif du parcours est de former des spécialistes en Probabilités, Statistique et Modélisation aléatoire et déterministe, en vue d’application aux Sciences du Vivant (Biologie, Santé, Médecine).

Plus précisément, le parcours assure une initiation à la recherche fondamentale en vue d’une thèse sur l’un des thèmes :

  •  Statistique mathématique et modélisation (statistique paramétrique ou non paramétrique, applications biostatistiques, contrôle des risques, survie, correction de censure, variations géographiques, propagation d’épidémies…)
  •  Probabilités et applications aux sciences du vivant (Champs aléatoires pour la modélisation de milieux 3D, milieux poreux, transformées de Radon pour l’analyse de champs anisotropes et modélisation du procédé de radiographie, …).
  •  Modèles stochastiques en biologie (Equations différentielles stochastiques, application aux modèles neuronaux, génétiques, pharmacocinétiques, modèles mixtes, …)
  •  Modélisation déterministe en science du vivant (systèmes d’équations aux dérivées partielles, méthodes variationnelles, modélisation myocardique, déformations cellulaires, circulation artérielle, …)

La thèse éventuelle pourra se dérouler au sein de laboratoires universitaires de Mathématiques appliquées, d’Unités INSERM, à l’INRA, au CEA, dans des unités de recherche des hôpitaux, ou des cellules de recherche en entreprise (Industrie ou services). Le parcours propose également des débouchés professionnels, par le biais de stages dans :

  •  des entreprises telles que Danone, l’Oréal,
  •  des Laboratoires pharmaceutiques (GlaxoSmithKline, Sanofi Aventis,…) ,
  •  des instituts tels que l’Institut de Veille Sanitaire (InVS), l’Agence Française de Sécurité Sanitaire des Aliments (AFSSA) …,
  •  des sociétés de biotechnologie.

La formation fournit des bases générales permettant des stages dans des domaines autres que les Sciences du Vivant  (Instituts de sondage, cellules d’études statistiques…).

Intervenants. Les intervenants sont des enseignants chercheurs de l’UFR de Mathématique et Informatique et de l’UFR Biomédicale, membres du Laboratoire MAP5 (UMR Cnrs 8145), des chercheurs de l’INRA, de l’Institut de radioprotection et de sûreté nucléaire (IRSN).

Le programme des deux années

M1 Semestre 1 (Mathématiques appliquées)
UE Analyse et probabilités
Probabilités avancées (MMK1E11)

Probabilités avancées (MMK1E11)

cours: 30h TD: 30h

Objectifs :

Initiation aux processus en temps discret. Compréhension de l'espérance conditionnelle. Martingales à temps discret et les théorèmes de convergence associés.

Compétences acquises :

Espérance conditionnelle, martingale en temps discret

Programme:

Définition de l'espérance conditionnelle généraleTribus, temps d'arrêtMartingales à temps discretInégalités (maximale, Doob,...).Convergence presque sûre des martingalesConvergence dans L^p

Analyse fonctionnelle (MMK1E12)

Analyse fonctionnelle (MMK1E12)

cours: 15h TD: 15h



Analyse de Fourier (MMK1E13)

Analyse de Fourier (MMK1E13)

cours: 15h TD: 15h

Objectifs :

L'analyse de Fourier et ses prolongements (ondelettes, analyse harmonique, ...) jouent un rôlecentral dans beaucoup de problèmes de mathématiques appliquées (équations différentielles et équations aux dérivées partielles, analyse numérique, convolution, traitement du signal et de l'image, etc). L'objectif de ce cours est de donner des bases mathématiques solides dans ce domaine.

Compétences acquises :

Transformations de Fourier continue et discrète.Applications de la transformée de Fourier.

Programme:

* Rappels sur les séries de Fourier * Transformée de Fourier dans L1, propriétés, calculs. Liens avec la convolution. * Formule d'inversion. Impact de la régularité d'une fonction sur sa transformée de Fourier. * Transformée de Fourier dans L2: construction, propriétés, exemples. * Espace de Schwartz et transformée de Fourier. Stabilité. Propriétés de densité. * Transformée de Fourier discrète, transformée de Fourier rapide. Lien entre séries de Fourier, transformée de Fourier, et transformée de Fourier discrète. Applications.

UE Algorithmique, programmation
Programmation (MML1E21)

Programmation (MML1E21)

cours: 15h TP: 15h

Objectifs :

L'objectif de ce cours est de familiariser les étudiants avec la programmation et avec les logiciels de calcul scientifique.

Compétences acquises :

Connaître et maîtriser les structures basiques de la programmation (variables, scripts, boucles, récursivité) et les limites du calcul numérique. Etre capable de concevoir et de programmer des algorithmes simples dans un langage fonctionnel (par exemple Scilab, Matlab, Octave, R), afin de résoudre numériquement des problèmes de calcul scientifique et/ou de simuler des phénomènes concrets issus de différents domaines applicatifs (physique, biologie, etc.).

Programme:

Chaque séance donne lieu à l'implémentation d'algorithmes classiques d'analyse numérique. 1. Introduction2. Résolution de systèmes linéaires (Gram-Schmidt, décomposition LU)3. Traitement d'images (filtres et débruitage)4. Analyse de données (moindres carrés, K-means, RANSAC)5. Résolution d'équations non linéaires (dichotomie, Newton-Raphson)6. Simulations de phénomènes aléatoires

Optimisation, algorithmique (MML1E31)

Optimisation, algorithmique (MML1E31)

cours: 15h TP: 15h

Compétences acquises :

L'étudiant(e) apprend les notions fondamentales d'optimisation. Ces bases devront lui permettre d'aborder une grande partie des méthodes existantes afin de les adapter et appliquer à un problème donné.

Programme:

Rappels et compléments d'algèbre linéaire numérique :- factorisation LU et Cholesky pour systèmes linéaires ;- décomposition en valeurs singulières ;- résolution de systèmes au sens des moindres carrées ;Algorithmes de minimisation sans contrainte :- méthodes de descente, vitesse de convergence, minimisation en 1D ;- cas particuliers : méthode de descente du gradient, méthode de Newton et quasi-Newton, méthode du gradient conjugué, méthode de Gauss-Newton, méthode de Levenberg-Marquardt,Les algorithmes seront programmées et testées en travaux pratiquessur machine avec Scilab.

Modélisation mathématique (MMK1E23)

Modélisation mathématique (MMK1E23)

cours: 15h TP: 15h



UE Ouverture
Traitement linéaire du signal (MMK1E31)

Traitement linéaire du signal (MMK1E31)

cours: 15h TD: 15h



Phénomène de transport en biologie (MML1E34)

Phénomène de transport en biologie (MML1E34)

cours: 15h TD: 15h



Anglais (MML1E51)

Anglais (MML1E51)



M1 Semestre 2 (Mathématiques appliquées)
UE Fondamentale
Statistiques (MMK2E11)

Statistiques (MMK2E11)

cours: 30h TD: 30h



Distributions et théorie de l'échantillonnage (MMK2E12)

Distributions et théorie de l'échantillonnage (MMK2E12)

cours: 15h TD: 15h

Programme:

Introduction à la théorie des distributions. Transformée de Fourier d'une distribution tempérée et convolution. Transformée de Laplace des distributions. Séries de Fourier de distributions périodiques. Echantillonnage (théorème de Shannon-Nyquist).

Méthodes variationnelles et EDP (MMK2E13)

Méthodes variationnelles et EDP (MMK2E13)

cours: 15h TD: 15h

Objectifs :

Présenter et étudier les équations aux dérivées partielles utilisées dans la modélisationdéterministe en médecine, biologie, mécanique, physique. On fera l'étude des propriétésdes équations et de leurs solutions au sens classique avant d'introduire la notion de solution faible. On abordera le problème de la résolution numérique à travers les schémas aux différences finies et la méthode des éléments finis.

Compétences acquises :

L'étudiant suit le chemin depuis la modélisation jusqu'à la résolution numérique sur des exemples standards d'e.d.p. Ceci lui permet de s'approprier les bases des techniques modernes de modélisation par e.d.p.

Programme:

Rappels et compléments d'analyse vectorielle.Modélisation de phénomènes de diffusion etéquations d'advection-réaction-diffusion.Schémas aux différences finies : consistance et stabilité.Équations aux dérivées partielles linéaires elliptiques d'ordre 2.Exemples classiques et formulation variationnelle.Introduction aux espaces de Sobolev.Méthode des éléments finis.

Optimisation sous contrainte (MMK2E14)

Optimisation sous contrainte (MMK2E14)

cours: 15h TP: 15h



Spécialisation 3 ECU à choisir parmi
Chaînes de Markov (MMK2E21)

Chaînes de Markov (MMK2E21)

cours: 15h TD: 15h



Séries temporelles (MMK2E22)

Séries temporelles (MMK2E22)

cours: 15h TD: 15h



Logiciels statistiques (MML2E22)

Logiciels statistiques (MML2E22)

cours: 15h TP: 15h

Programme:

Initiation aux logiciels SAS, SPSS et SPAD

Modèles linéaires gaussiens (MMK2E23)

Modèles linéaires gaussiens (MMK2E23)

cours: 15h TD: 15h

Objectifs :

Les modèles linéaires gaussiens permettent de rendre compte et d'analyser les relations qui peuvent exister entre plusieurs variables. Très utilisés en statistique, ils couvrent le champ de la régression linéaire et celui de l'analyse de la variance. Ce cours a pour objectif de présenter les principaux éléments de théorie résultant de l'étude des modèles linéaires gaussiens, tout en abordant de manière concrète les situations classiques qui justifient l'utilisation de ces modèles.

Compétences acquises :

L'étudiant acquerra les bases théoriques et un savoir-faire sur les modèles linéaires gaussiens. Un accent particulier sera mis sur les modèles de regression simple ou multiple et sur les modèles ANOVA d'analyse de la variance à un ou plusieurs facteurs.

Programme:

1) Introduction aux modèles linéaires gaussiens.2) Modèles3) Estimation4) Tests5) Sélection de modèles.

Théorie de l'information (MMK2E26)

Théorie de l'information (MMK2E26)

cours: 15h TD: 15h

Objectifs :

La théorie de l'information, inventée par Shannon en 1948, est non seulement à la base de toutesles communications numériques actuelles, mais séduit aussi par sa portée mathématique, physique, et philosophique qui va bien au-delà. L'objectif de ce cours est de comprendre les concepts fondamentaux de la théorie de l'information, à commencer par la notion d'entropie.

Compétences acquises :

Notions élementaires de théorie de l'information: entropie, codage.Principes de la communication à travers un canal bruité.

Programme:

* Arbres de décision et entropie algébrique. * Entropie probabiliste. Propriétés. * Entropie conditionnelle. Information mutuelle. Distance de Kullback. * Propriété d'équirépartition asymptotique. Suites typiques. * Codage: codes réguliers, déchiffrables, complets, codes de préfixe. * Inégalité de Kraft. Premier théorème de Shannon. * Codage de Huffman, optimalité. Lien entre codage et détermination de stratégies optimales. * Taux d'entropie de sources avec mémoire. Codage Lempel-Ziv. * Communication à travers un canal bruité. Deuxième théorème de Shannon. Example du code de Hamming 7,4. ***

Bases mathématiques du traitement d'image (MMK2E25)

Bases mathématiques du traitement d'image (MMK2E25)

cours: 15h TP: 15h

Programme:

Ce cours a pour but, à partir de problèmes inverses classiques en traitement d'images (restauration, segmentation) et en s'appuyant sur des applications bio-médicales, de présenter des techniques de mathématiques appliquées qui permettent de donner une réponse à ces problèmes :Approches linéaires (transformée de Fourier, en ondelettes),Approches géométriques (morphologie mathématique, EDP, contours actifs),Approches stochastiques (méthodes bayesiennes, champs markoviens...).Des chaînes de traitement utilisant plusieurs de ces approches successivement seront aussi présentées.

Projet tutoré (MMK2U3)

Projet tutoré (MMK2U3)



M2 Semestre 3 (Mathématiques appliquées : modélisation et statistique pour la biologie)
UE Modélisation
Modélisation déterministe en sciences du vivant (MMK3E11)

Modélisation déterministe en sciences du vivant (MMK3E11)

cours: 20h



Calcul stochastique (MMK3E12)

Calcul stochastique (MMK3E12)

cours: 20h



Équations différentielles stochastiques et modèles biologiques (MMK3E13)

Équations différentielles stochastiques et modèles biologiques (MMK3E13)

cours: 20h



Systèmes de particules et applications (MMK3E14)

Systèmes de particules et applications (MMK3E14)

cours: 20h



UE Statistique 4 ECUE à choisir parmi
Statistique non paramétrique adaptative et survie (MMK3E21)

Statistique non paramétrique adaptative et survie (MMK3E21)

cours: 15h TD: 15h



Statistique en contexte dépendant (MMK3E22)

Statistique en contexte dépendant (MMK3E22)

cours: 20h



Sélection de variables en grande dimension (MMK3E23)

Sélection de variables en grande dimension (MMK3E23)

cours: 20h



Durée de survie (MML3E12)

Durée de survie (MML3E12)

cours: 10h TD: 10h

Objectifs :

Les objectifs de ce cours sont d'analyser des données issues d’une étude de survie, de savoir interpréter les résultats et de savoir discuter les hypothèses des différents modèles. Dans un premier temps, la modélisation des durées de survie via des approches non paramétriques sera étudiée. Dans un second temps, l'ajustement sur des covariables sera considéré via le modèle de régression semi-paramétrique de Cox. Les hypothèses de validité de ce modèle seront également discutées.

Compétences acquises :

L'étudiant sera capable de formuler un modèle susceptible de convenir à ses données, de comparer les survies observées sur plusieurs groupes et de mettre en place le modèle de Cox. Un accent particulier est mis sur l'’interprétation des résultats et la mise en pratique via le logiciel R de tels modèles.

Programme:

- Généralités, Fonctions de survie, Relation entre les diverses fonctions de survie, Censure à droite- Estimation nonparamétrique des quantités de base (l'estimateur de Kaplan-Meier de la fonction de survie, l'estimateur de Nelson-Aalen de la fonction de hasard cumulée,...)- Tests d'hypothèse concernant l'égalité de deux ou plusieurs courbes de survie- Modèles à hasards proportionnels  - Modèle de Cox, Vraisemblance conditionnelle de Cox,- Estimations et tests dans le modèle de Cox - Analyse des résidus et extensions possibles du modèle de Cox

Epidémiologie approfondissement (MML3E32B)

Epidémiologie approfondissement (MML3E32B)

cours: 15h TD: 15h



Modèle linéaire généralisé (MMK3E26)

Modèle linéaire généralisé (MMK3E26)

cours: 10h TD: 10h



Propagation épidémie (MML3E14)

Propagation épidémie (MML3E14)

cours: 10h TD: 10h

Objectifs :

Les objectifs de ce cours est d'étudier les modèles dynamiques déterministes de propagation des épidémies dans une population en vue d'en comprendre le mécanisme et ainsi de mieux les contrôler voire de les éradiquer. . Les modèles étudiés dans ce cours sont de types SIS, SIR, SIRS avec et sans effets démographiques de la population ; ils s'exprimerons sous la fome d'un système différentiel non linéaire et nous en étudierons l'aspect qualitatif de leurs solutions (recherche de points d'équilibres, nature de ces points, interprétation épidémiologique de ces points, stabilité locale, voire globale de ceux-ci,...).

Compétences acquises :

Sur la base de la description d'une maladie, savoir construire un modèle dynamique déterministe de type S(E)IS ou S(E)IR(S), de calculer le nombre R0, paramètre essentiel en épidémiologie mathématique et d'étudier la stabilité locale des points d'équilibre du modèle construit.

Programme:

Introduction à l'épidémiologie mathématiqueEquations différentiels : étude des points d'équilibre, stabilité locale, système planaire.Etude des modèles SI et SISEtude du modèle SIR sans naissance-mortEtude du modèle SIRS sans naissance-mortEtude des modèles SIR et SIRS avec naissances et morts

UE Algorithmique et programmation 2 ECUE à choisir parmi
Algorithmes MCMC (MML3E23)

Algorithmes MCMC (MML3E23)

cours: 15h TD: 15h



Algorithmique Statistique (MML3E21)

Algorithmique Statistique (MML3E21)

cours: 15h TD: 15h



Bases de données avancées (MML3E22)

Bases de données avancées (MML3E22)

cours: 15h TD: 15h

Objectifs :

L'objectif de ce module est d'approfondir les concepts et l’architecture des bases de données relationnelles. Les pratiques de niveau simple jusqu’au niveau compliqué seront effectuées dans l’environnement ORACLE, la base de données la plus utilisée dans les entreprises.

Compétences acquises :

Connaissances sur les concepts et l’architecture physique, logique et process d’une base de données de nos jours. Connaissances approfondies du langage SQL, langage procedural, l’intégration avec du JAVA, XML. Administration et développement dans une base de données.

Programme:

- Modèle relationnel, E.F.CODD - L’architecture physique, logique et les process - Le langage SQL : LID (Lanage d’interrogationd es données), LMD (Langage de manipulation des données), COMMIT/ROLLBACK, LDD (Langage de définitiond es données),LCD (Langage de contrôle de données) - Base OLTP (Online Transactional Processing), OLAP (Online Analytical Processing) - Connexion locale et distante - L’architecture mémoire : SGA (System Global Area), PGA (Program Global Area) - Les process background, les process server, le sprocess clients, listener, tnsnames - L’architecture physique : Les fichiers de contrôle, les fichiers de données, les fichiers redolog - Cryptage des données - Option procédurale - Options avancées - Intégration JAVA,XML dans la base de données

Programmation (MML1E21)

Programmation (MML1E21)

cours: 15h TP: 15h

Objectifs :

L'objectif de ce cours est de familiariser les étudiants avec la programmation et avec les logiciels de calcul scientifique.

Compétences acquises :

Connaître et maîtriser les structures basiques de la programmation (variables, scripts, boucles, récursivité) et les limites du calcul numérique. Etre capable de concevoir et de programmer des algorithmes simples dans un langage fonctionnel (par exemple Scilab, Matlab, Octave, R), afin de résoudre numériquement des problèmes de calcul scientifique et/ou de simuler des phénomènes concrets issus de différents domaines applicatifs (physique, biologie, etc.).

Programme:

Chaque séance donne lieu à l'implémentation d'algorithmes classiques d'analyse numérique. 1. Introduction2. Résolution de systèmes linéaires (Gram-Schmidt, décomposition LU)3. Traitement d'images (filtres et débruitage)4. Analyse de données (moindres carrés, K-means, RANSAC)5. Résolution d'équations non linéaires (dichotomie, Newton-Raphson)6. Simulations de phénomènes aléatoires

Classification (MML1E32)

Classification (MML1E32)

cours: 15h TD: 15h

Objectifs :

Les méthodes de classification permettent de faire des partitions d'individus en groupes ayant un comportement similaire. Ce cours a pour objectif de présenter quelques unes des principales méthodes de classification et de les mettre en œuvre sur des exemples concrets.

Compétences acquises :

L'étude théorique de différentes méthodes de classification et leur utilisation pratique sous le logiciel R.

Programme:

Classification non supervisée (Classification ascendante hiérarchique, Centres mobiles).Classification supervisée (Méthode CART, k plus proches voisins, Méthodes de rééchantillonnage (Validation croisée)).

M2 Semestre 4 (Mathématiques appliquées : modélisation et statistique pour la biologie)
STAGE M2 (MMK4U1)

STAGE M2 (MMK4U1)




Candidatures

Vous trouverez sur la page des candidatures toutes les informations utiles.