En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal Logo Biogeco Logo Université de Bordeaux

Nouveau site web Biogeco

PLEIADE

Equipe Pleiade

Le calcul scientifique intensif pour mieux comprendre les patterns de biodiversité

 

Animateur : Alain Franc, alain.franc_at_inra.fr

Gestionnaire référente : Florence Le Pierres

Contexte et enjeux

La connaissance et préservation de la biodiversité est un enjeu crucial qui doit être présent à l’esprit lors de toute conception et réalisation d’une activité humaine. La connaissance de la diversité notamment en espèces est à la base de la compréhension de la dynamique des communautés. Or, cette diversité est mal connue, malgré plusieurs siècles d’histoire naturelle. Plusieurs « révolutions » permettent d’aborder cette connaissance avec des concepts, outils et méthodes nouveaux :

  • le rapprochement entre évolution, biologie moléculaire, systématique et génétique qui permet de comprendre la diversité actuelle comme fruit d’une histoire évolutive (phylogénies, systématique moléculaire) ;
  • la révolution des NGS qui permet d’avoir accès à la diversité moléculaire de communautés entières, tous organismes confondus  (métabarcoding) ;
  • une révolution numérique actuelle associant données massives  et accès au calcul intensif, avec le développement de méthodes d’analyse issues de l’IA

Pleiade a comme enjeu de contribuer au développement des outils et méthodes numériques en métabarcoding, avec investissement dans le calcul intensif, pour une meilleure caractérisation des patterns de diversité. Pour ce faire Pleiade est une composante d’une équipe mixte Inra/Inria. (voir https://www.inria.fr/equipes/pleiade).

Objectifs et stratégie scientifique

L’activité de Pleiade s’articule globalement autour des éléments suivants :

  • au sein du réseau R-Syst, favoriser les échanges et discussions autour de la notion d’espèce, comment elle se décline selon les grands groupes taxonomiques du réseau (des bactéries aux insectes) ; analyser la qualité du dictionnaire entre taxonomie à base morphologique (celle sur laquelle la systématique est fondée) et à base moléculaire (barcoding), en associant des équipes produisant et maintenant des bases de référence (bactéries, micro-algues, plantes, champignons, nématodes, insectes), en collaboration avec l’infrastructure Rare
  • étudier les associations d’espèces au sein des communautés selon des déterminants de type spatial, temporel, ou environnemental (assemblage des communautés)
  • en amont de cette activité, contribuer à l’évolution des outils et méthodes d’inventaires des communautés, en collaboration avec la communauté scientifique du calcul intensif pour faciliter le passage à l’échelle (coll. HiePACS, SED Inria, IDRIS, GRICAD, …), et l’unité MIAT pour l’appui sur les méthodes statistiques (statistique computationnelle)
  • transférer les outils et méthodes en métabarcoding vers les équipes de recherche utilisatrices, notamment via des collaborations avec la plateforme PGTB ; les (in)valider  par une comparaison avec les outils acceptés comme état de l’art actuel (outils derrière Mothur, QIIME, DADA2, le BLAST, SWARM, …) ;
  • accompagner voire devancer les évolutions dans les outils rendues nécessaires par l’évolution des technologies de séquençage, comme l’émergence actuelle des techniques dites « longs reads », par une proximité et collaboration avec la plateforme PGTB de séquençage/génotypage

Un « focus » particulier est réalisé sur le traitement des données massives issues de NGS qui pose des problèmes partiellement résolus. La plupart des méthodes ont en effet été conçues alors que les jeux de données étaient de taille « accessible » (données Sanger). Le passage à l’échelle sur données issues de NGS se réalise à l’aide d’heuristiques (algorithmes gloutons, etc …). La stratégie de Pleiade quant aux méthodes et outils est double :

  • aller le plus loin possible (en terme de taille des fichiers à analyser) avec des méthodes exactes et contrôlées, afin notamment d’assurer une répétabilité des traitements, et de proposer des benchmarks de comparaison avec la diversité des heuristiques disponibles. Cela requiert le recours au calcul intensif (parallélisation, distribution), qui est un des axes de développement de Pleiade ;
  • relier la caractérisation de la diversité aux outils et méthodes de l’apprentissage (machine learning), notamment s’appuyer sur les outils et méthodes de l’apprentissage supervisé pour la construction d’inventaires avec bases de référence, et l’apprentissage non supervisé pour la construction d’OTUs.

La stratégie scientifique de Pleiade, qui est une petite équipe (deux chercheurs, trois ingénieurs chacun à temps partiel) est de développer un réseau puissant de collaborations suivies, notamment

  • au sein de la communauté du calcul intensif, grâce à la double affiliation Inra/Inria, prolongée avec l’unité MIAT pour les statistiques computationnelles
  • au sein de la communauté européenne du métabarcoding, grâce au projet COST DNAqua.net
  • par une association entre les outils (enjeu de Pleiade) et les données biologiques, au sein du réseau Inra R-Syst
  • avec les équipes en Guyane (IPG) quant aux questions liées à la biodiversité

Mots-clés : Metabarcoding – Ecologie des communautés – Systématique à base moléculaire - NGS – Données massives – Méthodes et algorithmes – Calcul intensif – Apprentissage supervisé et non supervisé.

Personnel

L’équipe est composée de deux chercheurs, à temps complet, et de trois ingénieurs, à temps partiel.

Permanents

Doctorants en co-encadrement

Emilie Chancerel
(IE à 20% et 80% au PCM PGTB)

Sourakhata Tirera
(Institut Pasteur de Guyane, Univ. de Cayenne, co-direction (direction : Anne Lavergne, IPG))

Alain Franc
(DR à 100% animateur)

Bonnie Bailet
(SLU, Uppsala, co-direction (direction : Maria Kahlert, SLU))

Jean-Marc Frigerio
(IR à 80%et 20% PCM informatique)

Simon Labarthe
(CR Département MIA)

Franck Salin
(IE à 50% et 50% PCM informatique)

Projets de recherche

- projet R-Syst : réseau Inra associant des équipes des départements SPE et EFPA essentiellement
- projet Microbiome : projet stratégique du labex CEBA ; collaboration avec l’Institut Pasteur de Guyane sur la caractérisation de la diversité des viromes d’animaux vecteurs de zoonose en Guyane.
- projet Malabar : projet du labex COTE : caractérisation de la diversité interspécifique des communautés de protistes du Bassin d’Arcachon ; collaboration avec l’IFREMER et la chaire ETI du labex COTE
- projet « aerobarcoding » : projet de développement du labex COTE sur l’identification, à partir de lames de capteurs du RNSA (Réseau National de Surveillance Aérobiologique), des pollens d’espèces allergènes par métabarcoding.
- projet « HPC Scalable Ecosystem » coordonné par Inria Bordeaux (Hiepacs), dont Pleiade est membre (passage à l’échelle des outils de caractérisation de la biodiversité sur des jeux de données massifs)
- projet ADT Gordon, financé par l’Inria ; consortium de quatre équipes Inria Bordeaux pour la consolidation d’une pile logicielle pour traiter de grands jeux de données en algèbre linéaire distribuée (passage à l’échelle pour le traitement de données massives)
- projet « EOSC-Pillar », projet Européen de l’EOSC ; Pleiade est impliquée dans la tâche 7.4 sur l’interopérabilité entre infrastructures, en collaboration avec Inria Bordeaux (Hiepacs, SED), l’IDRIS (CNRS, Centre National de calcul), et GRICAD (mésocentre de Grenoble)
- Projet COST DNAqua.net : réseau européen sur l’utilisation du métabarcoding pour l’évaluation de la qualité des eaux (notamment via l’indice de polluo-sensibilité à partir d’inventaires de diatomées) ; AF est co-animateur du WG4 (Data analysis and storage).