Vous cherchez...

 
Une recherche
   
   
 
 
Statistique et algorithmique pour la biologie
(ACR)
- Mot(s) clé(s) :
Objet d'étude : activité de recherche, biologie intégrée, eucaryote, procaryote, quantitative trait locus, satisfaction de contraintes
Question sociétale et finalité, contexte : intérêt agronomique, intérêt scientifique, mission de recherche, production scientifique, variabilité génétique
Démarche, discipline : Bioinformatics, Computational Complexity, informatique, Mathématiques, Méthodes et statistiques, Statistiques (Mathématiques)
Afficher la suite
Objet d'étude : activité de recherche, biologie intégrée, eucaryote, procaryote, quantitative trait locus, satisfaction de contraintes
Question sociétale et finalité, contexte : intérêt agronomique, intérêt scientifique, mission de recherche, production scientifique, variabilité génétique
Démarche, discipline : Bioinformatics, Computational Complexity, informatique, Mathématiques, Méthodes et statistiques, Statistiques (Mathématiques)
Dispositif technique et méthode d'étude : bioinformatique, cartographie génétique, marqueur moléculaire, modèle de mélange, optimisation combinatoire, prédiction de gènes, théorie des graphes
Composé chimique, Facteur du milieu : arn
Réduire

- Description détaillée :

L’équipe Statistique et Algorithmique pour la Biologie Afficher la suite

L’équipe Statistique et Algorithmique pour la Biologie (Unité de Biométrie et Intelligence Artificielle de Toulouse) regroupe des mathématiciens et informaticiens autour des thèmes de l’identification et la localisation d’éléments fonctionnels dans les génomes ainsi que l’inférence des relations pouvant exister entre eux. Les travaux réalisés visent à résoudre une question bioinformatique, en partenariat étroit avec des biologistes de l’INRA ou à l’extérieur de l’INRA.


Pour traiter ces problèmes, l’équipe mobilise et développe des méthodes en mathématiques, statistiques, probabilités (modélisation, inférence, régression pénalisée, modèles graphiques) et en informatique (modélisation, optimisation combinatoire, réseaux de contraintes, algorithmique) avec le but de les valoriser dans des outils logiciels directement utilisables par ses partenaires biologistes, et rendant compte le mieux possible de la complexité et de la variété des données utilisables. Le choix de modèles adaptés à la nature du problème, la conception de nouvelles méthodes et de nouveaux algorithmes, le développement de logiciels adaptés pour valoriser notre recherche constituent les éléments clés de notre approche.


L’équipe développe en particulier des méthodes originales dans le domaine de l’optimisation combinatoire, en s’appuyant sur les réseaux de contraintes pondérées, aussi appelés "réseaux de fonctions de coût", un type de modèle graphique dédié à l’optimisation et généralisant les réseaux de contraintes utilisés en programmation par contraintes. Ces techniques, implémentées dans l’outil toulbar2 (développé dans l’équipe et très bien placé dans différentes compétitions internationales), sont ensuite mises en oeuvre sur des problèmes issus de la bioinformatique (localisation d’ARNs de familles connues, diagnostics de pedigrees complexes de grande taille...).

Nous nous concentrons également sur le développement de nouvelles méthodes statistiques et algorithmiques pour mettre en évidence des interactions géniques. Les réseaux (ou les graphes) sont des outils puissants de représentation et d’analyse de ces interactions. Les noeuds du réseau peuvent être des gènes transcrits, des polymorphismes, des ARN... Un premier type de problème consiste à identifier des groupes de gènes co-régulés. Ce sont des questions de classification qui se posent à partir de données hybrides (données d’expression mais aussi co-citations par exemple). Les champs markoviens cachés ont été utilisés avec succès lorsque le graphe des interactions est (partiellement) connu au préalable. Au-delà de cette problématique de classification, notre principale implication
porte sur l’inférence de réseau (par exemple, dans le cadre de la génomique génétique qui associe dans un même réseau des données discrètes et des données continues mais également dans le cadre des réseaux de gènes d’ARN par l’analyse des similarités en séquence et en structure, les deux approches pouvant être combinées dans un cadre bayésien).


L’un des préalables à la mise en évidence d’interactions est la prédiction et la localisation des
éléments que l’on cherche à mettre en relation. L’équipe a une longue expérience dans le domaine de la détection et localisation de QTL, prédiction de gènes de protéines et d’ARN et a produit dans ce domaine des outils performants et largement utilisés. On peut citer à titre d’exemples : Carthagène  pour la cartographie génétique et d’hybrides irradiés,  MCQTL  pour la localisation de QTL ou Quantitative Trait Loci par analyse de la transmission allélique,   HAPim pour la localisation de QTL par modélisation du déséquilibre de liaison,   FrameD ou  EuGène pour l’identification de gènes codant pour des protéines dans les génomes bactériens ou eucaryotes, MilPat, DARN!, ApolloRNA,RNAspace pour l’identification d’ARN non codant pour des protéines.


Sur tous ces thèmes, l’équipe entretient des collaborations avec des équipes de l’INRA ou d’autres organismes de recherche en France ou à l'étranger. MCQTL s’enrichit de collaborations avec les entreprises privées et Toulbar2 bénéficie de collaborations avec l’Université Polytechnique de Catalogne et l’Institut de recherche en Intelligence Artificielle de Barcelone (CSIC).


Réduire

- Champs de rattachement :
 

En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +