Rechercher

sur ce site


Accueil du site > Résumés des séminaires > Labo > A la recherche de motifs statistiquement sur-représentés dans les génomes : des mots aux matrices poids-position

A la recherche de motifs statistiquement sur-représentés dans les génomes : des mots aux matrices poids-position

La détection de motifs d’ADN possédant des fréquences exceptionnellement grandes ou petites dans un génome aiguille souvent les biologistes moléculaires vers la découverte de nouveaux motifs fonctionnels d’intérêt. Ces motifs peuvent avoir des structures aussi simples qu’un mot sur l’alphabet (A, C, G, T) ou plus complexes comme on le verra dans l’exposé. Je ferai d’abord une présentation assez large de mes travaux ayant trait aux statistiques d’occurrences de motifs dans des séquences markoviennes, avec quelques exemples d’identification de motifs biologiques. Puis j’aborderai un travail en cours sur le calcul de significativité de la fréquence d’une matrice poids-position, représentation très courante en génomique pour un certain nombre de sites de fixation de protéines qui tolère une grande flexibilité sur les lettres du motif.

CMAP UMR 7641 École Polytechnique CNRS, Route de Saclay, 91128 Palaiseau Cedex France, Tél: +33 1 69 33 46 23 Fax: +33 1 69 33 46 46