Résumé
La métabolomique permet de déterminer des profils métaboliques, représentatifs de l’impact sur le métabolisme d’une condition expérimentale ou d’un phénotype particulier. En santé humaine, l’étude et la comparaison de ces profils permettent entre autres de caractériser des mécanismes pathologiques, des effets toxiques, ou d’identifier de nouvelles cibles pour le diagnostic. L’interprétation de ces profils requiert de recontextualiser les observations, à la fois dans leur contexte biochimique, mais aussi plus largement sur le plan biologique, en intégrant des connaissances externes issues de la littérature scientifique. Des bases de données chimiques à la littérature, toutes ces connaissances sont accessibles, mais leur volume et leur croissance limitent néanmoins leur exploration. Face à cette surcharge d’informations, de nouvelles stratégies doivent être mises en place pour aider le chercheur à exploiter ces connaissances. En s’appuyant sur les technologies du Web sémantique, les travaux présentés dans cette thèse proposent d’extraire et d’agréger un ensemble de relations entre composés chimiques et concepts biomédicaux, pour construire un graphe de connaissances ouvert: FORUM. Les liens associatifs entre concepts ont été inférés depuis leur fréquence de co-mention dans la littérature et augmentés par la représentation sémantique des entités, apportée par les vocabulaires chimiques et biomédicaux. Au-delà du support pour l’interprétation des profils métaboliques, le potentiel de FORUM pour la suggestion de nouvelles hypothèses et l’exploration des chemins de relations à travers le Web de données a également été discuté. Malgré sa croissance, la couverture de la littérature sur le métabolome reste partielle. Lors de l’interprétation de profils métaboliques, la quantité d’informations disponibles pour chaque composé observé peut ainsi être inégale. Afin d’étendre le graphe de connaissances aux métabolites négligés dans la littérature, une deuxième approche combinant analyses de réseaux et statistiques bayésiennes a été développée. Les nouvelles relations suggérées avec des maladies, sont dérivées de la littérature du voisinage métabolique du composé et fournissent un nouveau niveau de relation dans le graphe de connaissances.
Source: http://www.theses.fr/2022TOU30213
.