Parcours Modélisation et statistique pour la biologie

Conditions d’accès

Le parcours MSB est accessible aux étudiants titulaires d’un Master 1ère année en Mathématiques ou Mathématiques appliquées (ou diplôme étranger de niveau équivalent, ou dernière année de Grande Ecole d’Ingénieur). Un bon niveau en probabilités et statistique est requis.

Objectifs de la formation

L’objectif du parcours est de former des spécialistes en Probabilités, Statistique et Modélisation aléatoire et déterministe, en vue d’application aux Sciences du Vivant (Biologie, Santé, Médecine).

Plus précisément, le parcours assure une initiation à la recherche fondamentale en vue d’une thèse sur l’un des thèmes :

  •  Statistique mathématique et modélisation (statistique paramétrique ou non paramétrique, applications biostatistiques, contrôle des risques, survie, correction de censure, variations géographiques, propagation d’épidémies…)
  •  Probabilités et applications aux sciences du vivant (Champs aléatoires pour la modélisation de milieux 3D, milieux poreux, transformées de Radon pour l’analyse de champs anisotropes et modélisation du procédé de radiographie, …).
  •  Modèles stochastiques en biologie (Equations différentielles stochastiques, application aux mod

    Conditions d’accès

    Le parcours MSB est accessible aux étudiants titulaires d’un Master 1ère année en Mathématiques ou Mathématiques appliquées (ou diplôme étranger de niveau équivalent, ou dernière année de Grande Ecole d’Ingénieur). Un bon niveau en probabilités et statistique est requis.

    Objectifs de la formation

    L’objectif du parcours est de former des spécialistes en Probabilités, Statistique et Modélisation aléatoire et déterministe, en vue d’application aux Sciences du Vivant (Biologie, Santé, Médecine).

    Plus précisément, le parcours assure une initiation à la recherche fondamentale en vue d’une thèse sur l’un des thèmes :

    •  Statistique mathématique et modélisation (statistique paramétrique ou non paramétrique, applications biostatistiques, contrôle des risques, survie, correction de censure, variations géographiques, propagation d’épidémies…)
    •  Probabilités et applications aux sciences du vivant (Champs aléatoires pour la modélisation de milieux 3D, milieux poreux, transformées de Radon pour l’analyse de champs anisotropes et modélisation du procédé de radiographie, …).
    •  Modèles stochastiques en biologie (Equations différentielles stochastiques, application aux modèles neuronaux, génétiques, pharmacocinétiques, modèles mixtes, …)
    •  Modélisation déterministe en science du vivant (systèmes d’équations aux dérivées partielles, méthodes variationnelles, modélisation myocardique, déformations cellulaires, circulation artérielle, …)

    La thèse éventuelle pourra se dérouler au sein de laboratoires universitaires de Mathématiques appliquées, d’Unités INSERM, à l’INRA, au CEA, dans des unités de recherche des hôpitaux, ou des cellules de recherche en entreprise (Industrie ou services). Le parcours propose également des débouchés professionnels, par le biais de stages dans :

    •  des entreprises telles que Danone, l’Oréal,
    •  des Laboratoires pharmaceutiques (GlaxoSmithKline, Sanofi Aventis,…) ,
    •  des instituts tels que l’Institut de Veille Sanitaire (InVS), l’Agence Française de Sécurité Sanitaire des Aliments (AFSSA) …,
    •  des sociétés de biotechnologie.

    La formation fournit des bases générales permettant des stages dans des domaines autres que les Sciences du Vivant  (Instituts de sondage, cellules d’études statistiques…).

    Intervenants. Les intervenants sont des enseignants chercheurs de l’UFR de Mathématique et Informatique et de l’UFR Biomédicale, membres du Laboratoire MAP5 (UMR Cnrs 8145), des chercheurs de l’INRA, de l’Institut de radioprotection et de sûreté nucléaire (IRSN).

    Le programme des deux années

    M1 Semestre 1 (Mathématiques et Modélisation)
    UE Probabilités
    Probabilités avancées (MMK1E11)

    Probabilités avancées (MMK1E11)

    cours: 30h TD: 30h

    Objectifs :

    Initiation aux processus en temps discret. Compréhension de l'espérance conditionnelle. Martingales à temps discret et les théorèmes de convergence associés.

    Compétences acquises :

    Espérance conditionnelle, martingale en temps discret

    Programme:

    Définition de l'espérance conditionnelle généraleTribus, temps d'arrêtMartingales à temps discretInégalités (maximale, Doob,...).Convergence presque sûre des martingalesConvergence dans L^p

    UE Analyse
    Analyse de Fourier (MMK1E13)

    Analyse de Fourier (MMK1E13)

    cours: 15h TD: 15h

    Objectifs :

    L'analyse de Fourier et ses prolongements (ondelettes, analyse harmonique, ...) jouent un rôlecentral dans beaucoup de problèmes de mathématiques appliquées (équations différentielles et équations aux dérivées partielles, analyse numérique, convolution, traitement du signal et de l'image, etc). L'objectif de ce cours est de donner des bases mathématiques solides dans ce domaine.

    Compétences acquises :

    Transformations de Fourier continue et discrète.Applications de la transformée de Fourier.

    Programme:

    * Rappels sur les séries de Fourier * Transformée de Fourier dans L1, propriétés, calculs. Liens avec la convolution. * Formule d'inversion. Impact de la régularité d'une fonction sur sa transformée de Fourier. * Transformée de Fourier dans L2: construction, propriétés, exemples. * Espace de Schwartz et transformée de Fourier. Stabilité. Propriétés de densité. * Transformée de Fourier discrète, transformée de Fourier rapide. Lien entre séries de Fourier, transformée de Fourier, et transformée de Fourier discrète. Applications.

    Analyse fonctionnelle (MMK1E12)

    Analyse fonctionnelle (MMK1E12)

    cours: 15h TD: 15h

    Programme:

    Espaces de fonctions continues sur un compact (théorème d'Ascoli, théorème de Stone-Weierstrass), espaces de Hilbert (projection, base hilbertienne, adjoint), théorème de Banach-Steinhaus, dualité des espaces de Banach et de Hilbert (convergence faible, convergence faible-étoile, identification, théorème de représentation de Riesz, théorème de Lax-Milgram), applications compactes.


    UE Algorithmique et optimisation
    Programmation (MML1E21)

    Programmation (MML1E21)

    cours: 15h TP: 15h

    Objectifs :

    L'objectif de ce cours est de familiariser les étudiants avec la programmation et avec les logiciels de calcul scientifique.

    Compétences acquises :

    Connaître et maîtriser les structures basiques de la programmation (variables, scripts, boucles, récursivité) et les limites du calcul numérique. Etre capable de concevoir et de programmer des algorithmes simples dans un langage fonctionnel (par exemple Scilab, Matlab, Octave, R), afin de résoudre numériquement des problèmes de calcul scientifique et/ou de simuler des phénomènes concrets issus de différents domaines applicatifs (physique, biologie, etc.).

    Programme:

    Chaque séance donne lieu à l'implémentation d'algorithmes classiques d'analyse numérique. 1. Introduction2. Résolution de systèmes linéaires (Gram-Schmidt, décomposition LU)3. Traitement d'images (filtres et débruitage)4. Analyse de données (moindres carrés, K-means, RANSAC)5. Résolution d'équations non linéaires (dichotomie, Newton-Raphson)6. Simulations de phénomènes aléatoires

    Optimisation (MML1E31)

    Optimisation (MML1E31)

    cours: 15h TP: 15h

    Compétences acquises :

    L'étudiant(e) apprend les notions fondamentales d'optimisation. Ces bases devront lui permettre d'aborder une grande partie des méthodes existantes afin de les adapter et appliquer à un problème donné.

    Programme:

    Rappels et compléments d'algèbre linéaire numérique :- factorisation LU et Cholesky pour systèmes linéaires ;- décomposition en valeurs singulières ;- résolution de systèmes au sens des moindres carrées ;Algorithmes de minimisation sans contrainte :- méthodes de descente, vitesse de convergence, minimisation en 1D ;- cas particuliers : méthode de descente du gradient, méthode de Newton et quasi-Newton, méthode du gradient conjugué, méthode de Gauss-Newton, méthode de Levenberg-Marquardt,Les algorithmes seront programmées et testées en travaux pratiquessur machine avec Scilab.

    UE Spécialisation 1
    Modélisation déterministe et application à la biologie (MML1E34)

    Modélisation déterministe et application à la biologie (MML1E34)

    cours: 15h TD: 15h

    Programme:

    EDO (Modélisation des phénomènes de naissance, mort, compétition, mutualisme, prédation. Dynamique des populations. Modèles proies-prédateurs de type Lotka-Volterra. Dynamique adaptative...). - EDP hyperboliques : phénomènes de transport (Principes généraux et propriétés mathématiques. Équation de renouvellement. Bioconvection. Écoulements physiologiques...). - EDP paraboliques : phénomènes de diffusion (Principes généraux et propriétés mathématiques. Équation de Fisher-KPP. Systèmes de réaction-diffusion. Morphogénèse et motifs de Turing...). - Méthodes de discrétisation. Simulations numériques

    Théorie de l'information (MMK2E26)

    Théorie de l'information (MMK2E26)

    cours: 15h TD: 15h

    Objectifs :

    La théorie de l'information, inventée par Shannon en 1948, est non seulement à la base de toutesles communications numériques actuelles, mais séduit aussi par sa portée mathématique, physique, et philosophique qui va bien au-delà. L'objectif de ce cours est de comprendre les concepts fondamentaux de la théorie de l'information, à commencer par la notion d'entropie.

    Compétences acquises :

    Notions élementaires de théorie de l'information: entropie, codage.Principes de la communication à travers un canal bruité.

    Programme:

    * Arbres de décision et entropie algébrique. * Entropie probabiliste. Propriétés. * Entropie conditionnelle. Information mutuelle. Distance de Kullback. * Propriété d'équirépartition asymptotique. Suites typiques. * Codage: codes réguliers, déchiffrables, complets, codes de préfixe. * Inégalité de Kraft. Premier théorème de Shannon. * Codage de Huffman, optimalité. Lien entre codage et détermination de stratégies optimales. * Taux d'entropie de sources avec mémoire. Codage Lempel-Ziv. * Communication à travers un canal bruité. Deuxième théorème de Shannon. Example du code de Hamming 7,4. ***

    Anglais (MML1E51)

    Anglais (MML1E51)



    M1 Semestre 2 (Mathématiques et Modélisation)
    UE Statistiques
    Statistiques (MMK2E11)

    Statistiques (MMK2E11)

    cours: 30h TD: 30h

    Programme:

    Modèle statistique, identifiabilité - Estimation de paramètre et comparaison
    d'estimateurs - Lois empiriques et quantiles - Construction d'estimateurs par des méthodes de
    substitution (moments, quantiles) et par maximum de vraisemblance - Modèles réguliers et
    information de Fisher, efficacité - Intervalles de confiance - Régression linéaire multivariée -
    Réduction des données, exhaustivité, complétude, familles exponentielles - Tests paramétriques,
    hypothèses simples et complexes, Lemme de Neyman-Pearson, tests gaussiens.

    UE Processus stochastiques
    Chaînes de Markov (MMK2E21)

    Chaînes de Markov (MMK2E21)

    cours: 15h TD: 15h



    Séries temporelles (MMK2E22)

    Séries temporelles (MMK2E22)

    cours: 15h TD: 15h

    Programme:

    Processus du second ordre : vecteurs et processus gaussiens. - Processus
    stationnaire : fonction d'autocovariance, opérateur backward, filtrage linéaire, processus AR, MA,
    ARMA, prédiction linéaire, équations de Yule-Walker. - Représentation spectrale : séries de Fourier, densité spectrale, théorème d'Herglotz, filtrage et densité spectrale, existence de solutions pour les
    processus ARMA. - Estimation : estimation de la moyenne et de l'autocovariance

    UE EDP et distributions
    Méthodes variationnelles et EDP (MMK2E13)

    Méthodes variationnelles et EDP (MMK2E13)

    cours: 15h TD: 15h

    Objectifs :

    Présenter et étudier les équations aux dérivées partielles utilisées dans la modélisationdéterministe en médecine, biologie, mécanique, physique. On fera l'étude des propriétésdes équations et de leurs solutions au sens classique avant d'introduire la notion de solution faible. On abordera le problème de la résolution numérique à travers les schémas aux différences finies et la méthode des éléments finis.

    Compétences acquises :

    L'étudiant suit le chemin depuis la modélisation jusqu'à la résolution numérique sur des exemples standards d'e.d.p. Ceci lui permet de s'approprier les bases des techniques modernes de modélisation par e.d.p.

    Programme:

    Rappels et compléments d'analyse vectorielle.Modélisation de phénomènes de diffusion etéquations d'advection-réaction-diffusion.Schémas aux différences finies : consistance et stabilité.Équations aux dérivées partielles linéaires elliptiques d'ordre 2.Exemples classiques et formulation variationnelle.Introduction aux espaces de Sobolev.Méthode des éléments finis.

    Distributions et théorie de l'échantillonnage (MMK2E12)

    Distributions et théorie de l'échantillonnage (MMK2E12)

    cours: 15h TD: 15h

    Programme:

    Fonctions tests et distributions, opérations sur les distributions (dérivation, multiplication par une fonction), distributions tempérées (transformée de Fourier, convolution), distributions à support compact, distributions périodiques (série de Fourier, formule sommatoire de Poisson), échantillonnage (théorème de Shannon-Nyquist).

    UE Spécialisation 2
    Optimisation sous contrainte (MMK2E14)

    Optimisation sous contrainte (MMK2E14)

    cours: 15h TP: 15h

    Programme:

    Existence et Unicité. Cas convexe – Différentielle au sens de Gâteau. Ellipticité. –
    Condition d’optimalité du premier ordre. – Projection sur un convexe fermé. Exemples. Méthode du
    gradient projeté. Conditions de Karush-Kuhn-Tucker. Points réguliers. Cas de contraintes affines.
    Lagrangien. Dualité. Méthode d’Uzawa. Critère de convergence.

    Bases pour le traitement d'image (MMK2E25)

    Bases pour le traitement d'image (MMK2E25)

    cours: 15h TP: 15h

    Programme:

    Ce cours a pour but, à partir de problèmes inverses classiques en traitement d'images (restauration, segmentation) et en s'appuyant sur des applications bio-médicales, de présenter des techniques de mathématiques appliquées qui permettent de donner une réponse à ces problèmes :Approches linéaires (transformée de Fourier, en ondelettes),Approches géométriques (morphologie mathématique, EDP, contours actifs),Approches stochastiques (méthodes bayesiennes, champs markoviens...).Des chaînes de traitement utilisant plusieurs de ces approches successivement seront aussi présentées.

    UE Projet
    Projet tutoré (MMK2U3)

    Projet tutoré (MMK2U3)

    Objectifs :

    Savoir lire un article (qui peut être en Anglais), et apprendre à en faire la synthèse écrite et à l'exposer en un temps assez court (10 mn). La compréhension repose sur une implémentation informatique.

    Atelier Cap Emploi (MML3E51)

    Atelier Cap Emploi (MML3E51)

    cours: 15h



    M2 Semestre 3 (Mathématiques et Modélisation)
    UE Optimisation et apprentissage
    Optimisation déterministe (OptiDet)

    Optimisation déterministe (OptiDet)

    cours: 15h TD: 15h



    Algorithmes stochastiques (AlgoSto)

    Algorithmes stochastiques (AlgoSto)

    cours: 15h TD: 15h

    Programme:

    La définition classique des algorithmes en fait des processus déterministes : avec les mêmes données, la même suite d'opérations sera exécutée. Il s'avère que, dans certains cas, introduire de l'aléa dans la suite d'instructions définissant un algorithme peut s'avérer bénéfique. L'algorithme obtenu est alors appelé algorithme stochastique. Dans ce cours, nous étudierons des algorithmes stochastiques essentiels : l'algorithme EM (qui n'est pas, stricto sensu, un algorithme stochastique, mais est lié, dans sa conception, à ceux-ci), la méthode de Monte Carlo, l'échantillonnage préférentiel, l'algorithme de Hasting-Metropolis et le recuit simulé. Les deux derniers algorithmes appartiennent à la catégorie des algorithmes de type Markov Chain Monte Carlo (MCMC), construits à partir d'une chaîne de Markov. Les tâches effectuées par les algorithmes étudiés dans ce cours sont : l'estimation de paramètres ou de distributions, le calcul d'intégrales ou de quantités associées à des espérances, la simulation de variables aléatoires et processus suivant des lois données et l'optimisation de fonctions.

    Classification (MML1E32)

    Classification (MML1E32)

    cours: 15h TD: 15h

    Objectifs :

    Les méthodes de classification permettent de faire des partitions d'individus en groupes ayant un comportement similaire. Ce cours a pour objectif de présenter quelques unes des principales méthodes de classification et de les mettre en œuvre sur des exemples concrets.

    Compétences acquises :

    L'étude théorique de différentes méthodes de classification et leur utilisation pratique sous le logiciel R.

    Programme:

    Classification non supervisée (Classification ascendante hiérarchique, Centres mobiles).Classification supervisée (Méthode CART, k plus proches voisins, Méthodes de rééchantillonnage (Validation croisée)).

    Apprentissage en grande dimension (AppGDim)

    Apprentissage en grande dimension (AppGDim)

    cours: 15h TD: 15h



    UE Image et modélisation pour la biologie, 4 ECUE à choisir parmi
    Modélisation déterministe et application à la biologie (MMK3E11)

    Modélisation déterministe et application à la biologie (MMK3E11)

    cours: 15h TD: 15h

    Programme:

    EDO (Modélisation des phénomènes de naissance, mort, compétition,
    mutualisme, prédation. Dynamique des populations. Modèles proies-prédateurs de type Lotka-
    Volterra. Dynamique adaptative...). - EDP hyperboliques : phénomènes de transport (Principes
    généraux et propriétés mathématiques. Équation de renouvellement. Bioconvection. Écoulements
    physiologiques...). - EDP paraboliques : phénomènes de diffusion (Principes généraux et propriétés
    mathématiques. Équation de Fisher-KPP. Systèmes de réaction-diffusion. Morphogénèse et motifs
    de Turing...). - Méthodes de discrétisation. Simulations numériques.

    Mouvement brownien et calcul stochastique (MVTB)

    Mouvement brownien et calcul stochastique (MVTB)

    cours: 15h TD: 15h

    Programme:

    Les équations différentielles sont un formalisme mathématique qui permet de
    comprendre l'évolution des systèmes (physiques, chimiques, biologiques, démographiques,
    économiques, informatiques,...) au cours du temps. Il apparaît dans de nombreux contextes
    applicatifs que ce formalisme ne tient pas assez compte d'un certain aléa dû par exemple aux
    erreurs de mesure ou à l'évolution du milieu au cours du temps. L'objet de ce cours est d'expliquer
    comment y remédier en introduisant du bruit (ou, plus généralement, de l'aléa) dans les équations
    différentielles. De nombreux exemples issus de la biologie, de l'économie ou de la physique illustrent
    le propos. Le cours comprend une partie programmation, en R, en Scilab ou en Python (au choix).
    Les élèves qui le souhaitent pourront être initiés à Python, langage facile mais puissant, très utilisé à la fois dans le monde académique et dans l'industrie.
    Le plan du cours est le suivant: Variables, vecteurs et processus gaussiens. - Mouvement brownien. -
    Calcul stochastique et formule d'Itô. - Equations différentielles stochastiques (introduction,
    générateurs et ien avec les chaines de Markov discrètes).
    Des applications à la biologie, l'économie ou la physique sont données dans chaque chapitre.

    Modèles poissoniens et processus markoviens (POISSON)

    Modèles poissoniens et processus markoviens (POISSON)

    cours: 15h TD: 15h

    Programme:

    Les processus de Poisson sont des ensembles aléatoires de points dans l'espace
    qui servent à l'élaboration de nombreux modèles géométriques. Nous étudierons via des exemples
    les proprieties statistiques géométriques du processus booléen, modèle polyvalent qui sert pour
    l'étude des milieux poreux et des tissus, et des champs shot-noise, utilisés en imagerie ou en
    médecine. On évoquera également d'autres processus permettant de modéliser plus fidèlement la
    répulsion ou le clustering de particules, comme lesmesures de Gibbs ou les processus
    determinantaux.
    Les systèmes de particules en interaction sont des 'modèles jouets' utilisés en physique statistique
    ou en biologie. Ce sont des processus de Markov en temps continu, où l'évolution temporelle de
    chaque particule est régie par son interaction spatiale avec les autres particules. Après l'étude des
    processus markoviens de saut qui décrivent l'évolution d'une seule particule (construction,
    générateurs, semi-groupes, mesures invariantes; exemples), nous introduirons les systèmes de
    particules au travers de deux modèles caractéristiques, le processus d'exclusion simple (qui
    modélise par exemple des flux de voitures), et le processus de contact (qui modélise des
    propagations d'infections).

    Statistique non paramétrique (MML3E11)

    Statistique non paramétrique (MML3E11)

    cours: 15h TD: 15h

    Objectifs :

    L'objectif de ce cours est de présenter aux étudiants différentes méthodes d'estimation fonctionnelle. Ces méthodes peuvent être utilisées de façon autonomes ou bien afin de permettre de choisir un modèle paramétrique plus simple et plus facile à présenter à des professionnels ou des médecins.

    Programme:

    Estimation d'une densité par méthode de projection (bases fonctionnelles orthonormées, construction de l'estimateur, étude du biais, de la variance, compromis par sélection de modèle, programmation) - Estimation d'une densité par méthode de noyau (noyau d'ordre quelconque, construction et étude de l'estimateur, compromis biais-variance par sélection de fenêtre, programmation). - Estimation d'une fonction de régression avec les deux méthodes : noyau et projection, étude et comparaison. - Applications en modèles de survie: estimation non paramétrique d'une densité, d'un fonction de risque instantané (hazard rate) dans le cas de modèle avec censure droite, d'une fonction de répartition en présence de censure par intervalle.

    Imagerie biomédicale (MMK3E54)

    Imagerie biomédicale (MMK3E54)

    cours: 15h TP: 15h



    Vision par ordinateur et géométrie (VISION)

    Vision par ordinateur et géométrie (VISION)

    cours: 15h TD: 15h



    Problèmes inverses (PBINV)

    Problèmes inverses (PBINV)

    cours: 15h TD: 15h

    Programme:

    L'égalisation d'histogramme et son interprétation variationnelle : la fonctionelle de Caselles-Sapiro ;
    - Modification de la fonctionnelle de Caselles-Sapiro pour la correction des images en couleur inspirée par la perception visuelle humaine
    - Imagerie à gamme dynamique étendue (HDRI : High Dynamic Range Imaging) : la génération d'images HDR avec l'algorithme de Debevec-Malik et le problème du tone mapping.


    Perception, acquisition et analyse d'images (PERCEP)

    Perception, acquisition et analyse d'images (PERCEP)

    cours: 15h TD: 15h



    M2 Semestre 4 (Mathématiques et Modélisation)
    STAGE M2 (MMK4U1)

    STAGE M2 (MMK4U1)




    Candidatures

    Vous trouverez sur la page des candidatures toutes les informations utiles.

    èles neuronaux, génétiques, pharmacocinétiques, modèles mixtes, …)

  •  Modélisation déterministe en science du vivant (systèmes d’équations aux dérivées partielles, méthodes variationnelles, modélisation myocardique, déformations cellulaires, circulation artérielle, …)

La thèse éventuelle pourra se dérouler au sein de laboratoires universitaires de Mathématiques appliquées, d’Unités INSERM, à l’INRA, au CEA, dans des unités de recherche des hôpitaux, ou des cellules de recherche en entreprise (Industrie ou services). Le parcours propose également des débouchés professionnels, par le biais de stages dans :

  •  des entreprises telles que Danone, l’Oréal,
  •  des Laboratoires pharmaceutiques (GlaxoSmithKline, Sanofi Aventis,…) ,
  •  des instituts tels que l’Institut de Veille Sanitaire (InVS), l’Agence Française de Sécurité Sanitaire des Aliments (AFSSA) …,
  •  des sociétés de biotechnologie.

La formation fournit des bases générales permettant des stages dans des domaines autres que les Sciences du Vivant  (Instituts de sondage, cellules d’études statistiques…).

Intervenants. Les intervenants sont des enseignants chercheurs de l’UFR de Mathématique et Informatique et de l’UFR Biomédicale, membres du Laboratoire MAP5 (UMR Cnrs 8145), des chercheurs de l’INRA, de l’Institut de radioprotection et de sûreté nucléaire (IRSN).

Le programme des deux années


Candidatures

Vous trouverez sur la page des candidatures toutes les informations utiles.