TomExpress : unifier les données d’expression des gènes de tomate pour les rendre comparables

Développée par le laboratoire GBF et bientôt publiée dans la revue Plant Journal, TomExpress est une plateforme web qui permet de gérer, visualiser et traiter des données d’expression des gènes de tomate, issues de technologies de séquencage RNAseq.

Les données contenues dans TomExpress correspondent à des données d’expression RNAseq publiées et rendues publiques par différents laboratoires dans le monde. L’équipe qui a développé cet outil a ainsi collecté ces données brutes afin d’en proposer un traitement de novo. En effet, les équipes ayant déposé ces données n’avaient pas utilisé les mêmes méthodes bio-informatiques et bio-statistiques pour aligner et traiter ces données, créant ainsi une hétérogénéité. TomEpress en les retraitant à travers un pipeline unique - bio-informatique et bio-statistique - permet d’unifier ces données pour les rendre comparables.

Actuellement TomExpress contient des données issues de plus 200 conditions expérimentales différentes, (expression dans différents tissus de la tomate, expression à des traitements différents, expression à des stress biotiques/abiotiques).  

Donner une forme aux données

TomExpress est également doté d’un outil web permettant de visualiser l’expression des 35000 gènes qui ont été annotés chez la tomate, chaque gène étant nommé par son identifiant. Un outil de visualisation par « bar-plot » permet d’afficher l’expression des gènes, et de comparer leurs profils d’expression. L’expression des gènes peut également être directement visualisée sur un dessin de la plante et dans chaque tissu et chaque organe. Si l’on s’intéresse à plusieurs gènes, il est possible de faire du « clustering » hiérarchique pour identifier des gènes qui ont des profils d’expression similaires. L’ensemble de ces graphiques et données sont exportables en différents formats.

Cet outil web permet enfin la recherche de gènes dont l’expression est similaire, conduisant à l’identification de corrélations positives ou négatives entre un gène d’intérêt et ceux qui sont co-exprimés parmi les 35000 gènes de la tomate.

Un outil à disposition de tous

En relation forte avec les objectifs du LabEx TULIP, « cet outil peut être utile aux autres laboratoires de TULIP ou d’ailleurs qui travaillent sur la tomate, menant des expériences impliquant notamment des stress biotiques » nous précise Mohamed Zouine.