De Meulder, Bertrand
[FUNDP]
(eng)
This thesis contains two principal axes, namely the development of statistical and bioinformatics analyses of data from DNA chip analyses, and their application on biological data relative to the development of metastases induced by hypoxia. The different statistical and bioinformatics analyses are based on work previously performed in our lab for which we brought our contribution, as well as new innovative work performed in the course of this thesis.
First, we used a dataset retrieval tool (PathEx) to gather the datasets better suited to our goals. Then, using the results obtained in a benchmarking analysis of single gene statistical analysis methods, we analyzed these datasets using the best suited method. An innovative meta-analysis step performed on the results of the first analyses allowed us to detect differentially expressed genes recurrent in the datasets tested. Then, an over-representation analysis step was performed on the pathways contained in KEGG that allowed to sort the genes obtained at the previous step according to their biological function. In parallel, we developed a new geneset analysis method (FAERI), allowing to statistically test groups of genes biologically related, instead of individual genes. The comparison of the results of the two axes highlights groups of genes supposedly involved in the biological situations tested.
The application of these different steps on data related to metastasis and hypoxia allowed us to identify several hundred candidate genes, distributed in tens of pathways. A significant part of these genes are in accordance with recent literature. Moreover, we highlighted the implication of the spliceosome pathway in the metastasis process, which was previously unknown. 20 new candidate genes were identified in this particular pathway. These results suggest the implication of alternative splicing in the development of metastasis.
We have developed a statistical and bioinformatics analysis sequence allowing the highlighting of relevant candidate genes, as shown in the analysis of data related to the development of metastasis induced by hypoxia.
(fre)
Cette thèse comporte deux axes principaux, à savoir la mise en place d’outils bioinformatiques et statistiques d’analyse de données obtenues à l’aide de puces à ADN, ainsi que leur application à des données relatives au phénomène métastatique induit par l’hypoxie. Les différentes analyses bioinformatiques et statistiques développées s’appuient sur un savoir-faire qui a été construit au cours des dernières années et propre à notre laboratoire, auquel nous avons apporté notre participation ; ainsi que sur plusieurs contributions innovantes réalisées au cours de cette thèse.
Dans la première partie, nous avons utilisé une base de données (PathEx) afin de sélectionner les jeux de données les plus adaptés aux recherches que l’on souhaite effectuer. Ensuite, grâce à un outil de mesure des performances des analyses statistiques « single gene » que nous avons développé, nous avons sélectionné la méthode la plus adaptée aux différents jeux de données. L’utilisation d’une étape innovante de méta-analyse sur ces résultats et une analyse de sur-représentation effectuée sur les voies de signalisation contenues dans KEGG, nous ont alors permis respectivement d’identifier des gènes différentiellement exprimés de façon récurrente au sein des jeux de données et de trier ces gènes par fonction biologique. Parallèlement à cet axe d’analyse « single gene », nous avons développé une méthode d’analyse « geneset », appelée FAERI, permettant l’analyse statistique de groupes de gènes biologiquement reliés au lieu de gènes pris individuellement. La mise en commun des résultats de ces deux axes d’analyse (single gene et geneset) affine l’identification de groupes de gènes supposés être impliqués dans la problématique étudiée.
L’application de ces différentes étapes d’analyses sur des données relatives au phénomène métastatique et à l’hypoxie nous a permis d’identifier plusieurs centaines de gènes candidats, répartis dans plusieurs dizaines de voies de signalisation. Il est à noter qu’une grande partie des gènes identifiés dans ce travail sont en accord avec la littérature récente. De plus, nous avons découvert, et ce de façon toute à fait nouvelle, l’implication de la voie du spliceosome dans le phénomène métastatique, pour laquelle 20 nouveaux gènes candidats ont été identifiés. Ceci suggère que les phénomènes d’épissages alternatifs participent au développement des métastases.
Nous avons donc développé une séquence d’analyses statistiques et bioinformatiques permettant la mise en évidence de gènes candidats pertinents, comme montré lors de son application à la situation biologique du développement des métastases induites par l’hypoxie.
Bibliographic reference |
De Meulder, Bertrand. Identification de gènes impliqués dans les métastases induites par l'hypoxie, via l'analyse statistique et bioinformatique de banques de damiers à ADN. Prom. : Depiereux, Eric ; Michiels, Carine |
Permanent URL |
http://hdl.handle.net/2078.2/124359 |