Vous cherchez...

 
Une recherche
   
   
 
 
Statistique et génome
(ACR)
- Mot(s) clé(s) :
Objet d'étude : microarrays
Dispositif technique et méthode d'étude : analyse de séquences, analyse différentielle, arbre phylogénique, classification supervisée, comparative génomic hybridization, détection de gènes, détection de rupture, distribution probabiliste, microarray, modèle de mélange, modèle de mutation, modèle semimarkovien, normalisation, sélection de modèle, statistique des motifs
Composé chimique, Facteur du milieu : séquence d'acides aminés
Afficher la suite
Objet d'étude : microarrays
Dispositif technique et méthode d'étude : analyse de séquences, analyse différentielle, arbre phylogénique, classification supervisée, comparative génomic hybridization, détection de gènes, détection de rupture, distribution probabiliste, microarray, modèle de mélange, modèle de mutation, modèle semimarkovien, normalisation, sélection de modèle, statistique des motifs
Composé chimique, Facteur du milieu : séquence d'acides aminés
Réduire

- Description détaillée :
Les méthodes statistiques utilisées en :

- normalisation de microarrays, sont la méthode Afficher la suite
Les méthodes statistiques utilisées en :

- normalisation de microarrays, sont la méthode loess, le variogramme, les méthodes statistiques pour le contrôle de la qualité. L'analyse statistique détaillée des lames jaunes est un moyen important utilisé pour traquer les artefacts techniques ;

- analyse différentielle de microarrays, sont les tests multiples, le FDR, les modèles de mélanges et les méthodes de choix de modèles. Pour chaque gène, l'hypothèse e "La différence d'expression entre les deux traitements est e" est testée contre l'hypothèse alternative "La différence d'expression entre les deux traitements est non e". L'objectif du test est de décider à partir des données quelle est l'hypothèse à retenir. Le principe est de calculer une fonction des observations, la statistique de test, et de comparer sa valeur à sa distribution attendue s'il n'y a pas de différence d'expression. Les deux étapes importantes dans ces tests sont de modéliser convenablement la variance de la différence d'expression lors de la construction de la statistique de test et d'avoir un bon contrôle du nombre de faux-positifs ;

- un profil de microarrays CGH peut être interprété comme une succession de segments qui représentent des régions homogènes sur le génome dont les BACs présentent le même nombre de copies moyen. Nous modelisons un profil CGH par un processus aléatoire de distribution gaussienne dont les paramètres sont affectés par des changements à des coordonnées inconnues. La méthodologie statistique employée est la détection de rupture, dans le cadre de la sélection de modèles, pour déterminer le nombre de segments du profil.
Un autre problème se pose : la classification des zones du génome partageant le même nombre de copies en moyenne. Cette classification non supervisée est modélisée par un modèle de mélange dont les paramètres sont estimés par l'algorithme EM.

Le plus souvent, on détecte des motifs intéressant en comparant leur fréquence ou leur répartition à la fréquence ou à la répartition attendue sous un modèle simple (chaîne de Markov, processus de Poisson). La connaissance des propriétés statistiques de ces fréquences ou de ces répartitions est nécessaire pour détecter les motifs "exceptionnels".
URGV : une Chargée de Recherche est commune aux 2 unités,
Institut Curie : co-encadrement d'un doctorant sur les puces CGH,
Institut Pasteur, ESPCI, ENS, Université de Gent, INRA Génétique Animale : travail en commun et copublications,
Fournier Pharma et ECP : un doctorant en commun...
- les microarrays :

La normalisation est une étape cruciale du traitement des données issues du transcriptome. Elle consiste à éliminer ou atténuer les artefacts techniques (biais de couleur lié à l'intensité, effets aiguille...) sans pour autant éliminer ou atténuer le signal d'intérêt (le niveau d'expression différentielle des gènes). Elle permet également d'améliorer progressivement la qualité des plate-formes en détectant des artefacts dont certains pourront être éliminés par une meilleure pratique expérimentale (PMT, séchage, effet plaque, biais d'accrochage des fluorophores...).

Les méthodes statistiques utilisées en normalisation sont la méthode loess, le variogramme, les méthodes statistiques pour le contrôle de la qualité. L'analyse statistique détaillée des lames jaunes est un moyen important utilisé pour traquer les artefacts techniques.


L'objectif de l'analyse différentielle est d'identifier les gènes dont l'expression diffère entre les conditions étudiées. Généralement, l'analyse différentielle est réalisée pour comparer deux conditions. Le résultat est une liste de gènes qui sont stimulés ou réprimés dans une condition par rapport à l'autre. Ces informations sont ensuite utilisées pour essayer de regrouper les gènes en familles fonctionnelles.

Les méthodes statistiques utilisées sont les tests multiples, le FDR, les modèles de mélanges et les méthodes de choix de modèles. Pour chaque gène, l'hypothèse e "La différence d'expression entre les deux traitements est e" est testée contre l'hypothèse alternative "La différence d'expression entre les deux traitements est non e". L'objectif du test est de décider à partir des données quelle est l'hypothèse à retenir. Le principe est de calculer une fonction des observations, la statistique de test, et de comparer sa valeur à sa distribution attendue s'il n'y a pas de différence d'expression. Les deux étapes importantes dans ces tests sont de modéliser convenablement la variance de la différence d'expression lors de la construction de la statistique de test et d'avoir un bon contrôle du nombre de faux-positifs.


- les microarrays CGH :

L'objectif des expériences de microarrays CGH est de détecter et de cartographier les défauts chromosomiques (délétion/ amplification de gènes), en hybridant des cibles d'ADN génomiques entre un génome test et un génome de référence. Les sondes sur la puce sont des séquences d'ADN génomique (BACs) qui sont ancrées sur le génome. Les cibles sont consituées d'ADN génomiques extraits de deux échantillons (test et référence), marqués différentiellement avec les fluorochromes Cy3 et Cy5. Cette technique est surtout utilisée pour l'étude des défauts génétiques des tumeurs, mais aussi pour l'étude de maladies faisant intervenir des défauts génétiques de même nature, comme pour le retard mental par exemple.

Un profil CGH peut être interprété comme une succession de segments qui représentent des régions homogènes sur le génome dont les BACs présentent le même nombre de copies moyen. Nous modélisons un profil CGH par un processus aléatoire de distribution gaussienne dont les paramètres sont affectés par des changements à des coordonnées inconnues. La méthodologie statistique employée est la détection de rupture, dans le cadre de la séection de modèles, pour déterminer le nombre de segments du profil.
Un autre problème se pose : la classification des zones du génome partageant le même nombre de copies en moyenne. Cette classification non supervisée est modélisée par un modèle de mélange dont les paramètres sont estimés par l'algorithme EM.


- les statistiques des motifs :

Les statistiques sur les motifs font partie des outils de base dans l'analyse des séquences biologiques. Leur objectif est de détecter des motifs (de courtes suites de nucléotides) ayant un rôle particulier dans le fonctionnement des génomes.

Le plus souvent, on détecte des motifs intéressant en comparant leur fréquence ou leur répartition à la fréquence ou à la répartition attendue sous un modèle simple (chaîne de Markov, processus de Poisson). La connaissance des propriétés statistiques de ces fréquences ou de ces répartitions est nécessaire pour détecter les motifs "exceptionnels".
L'équipe Statistique et génome crée et développe de nouvelles méthodes statistiques pour l'analyse de données issues de la biologie moléculaire : détection de motifs, analyse des données d'expression.

Ses trois principaux sujets de recherche sont :
- les microarrays,
- les microarrays CGH,
- les statistiques de motifs. Réduire

- Champs de rattachement :
 

En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +