Edit Content

Seminaire E-Commerce recense pour vous les différents ateliers marketing digital et événements autour du numérique afin de vous accompagner dans votre formation dans le digital.

Vers un outil sémantique d’autocodage qualitatif pour l’évaluation de l’acceptabilité des innovations by Doriane Simonnet
<>div>

Thèse de doctorat en Sciences du langage Spécialité Informatique et sciences du langage

  • Résumé

    Les techniques du Traitement Automatique des Langues (TAL) et les méthodes d’analyse qualitative des données textuelles entretiennent une certaine affinité épistémologique. Malgré cela, l’analyse qualitative ne profite pas pleinement des apports potentiels du TAL. En particulier, les travaux visant à une réelle automatisation du codage qualitatif des données restent somme toute assez rares. Cette thèse se donne pour ambition d’investiguer le potentiel de différentes techniques du TAL dans cet objectif et pour une tâche qui nécessite un certain degré d’expertise humaine. Elle vise à la création d’un outil utilisable dans un contexte industriel et pour une méthode d’analyse spécifique qui permet d’évaluer l’acceptabilité des innovations. Cette méthode mobilise une grille de 20 codes qui présentent une complexité sémantique plus élevée que ceux traditionnellement utilisés en analyse qualitative outillée.Nous explorons les moyens de parvenir à effectuer cette tâche à travers une approche ascendante puis une approche descendante. Pour la première, nous réalisons une exploration lexicométrique sur un corpus de données d’études anciennes afin de définir le profil lexical des données attendues pour chaque code. Puis, nous traitons le problème qui nous est posé comme une tâche de classification en testant des classifieurs statistiques de plusieurs types. Nous investiguons également les possibilités offertes par la projection d’une ressource syntaxico-sémantique sur le corpus.Nous suivons ensuite une approche descendante moins conventionnelle. Pour celle-ci, nous réalisons une modélisation experte du paradigme de l’entretien qualitatif d’évaluation de l’acceptabilité sous forme d’ontologie. Cette modélisation est assortie à un lexique construit de manière ad hoc. Nous proposons ainsi une architecture originale d’outil d’analyse sémantique dans laquelle les triplets de l’ontologie servent de support à l’interprétation et dont des sous-ensembles constituent des règles de classification. Nous obtenons un outil d’analyse hyperspécialisé dont les performances dépassent celles obtenues par le machine learning sur notre corpus d’entraînement. Cet outil est porté jusqu’à l’opérationnalisation, par son intégration dans une plateforme d’autocodage, en vue de la mise en place d’un processus d’apprentissage continu.

  • Titre traduit

    Towards a qualitative autocoding semantic tool for the evaluation of the acceptability of innovations

  • Résumé

    The techniques of Natural Language Processing (NLP) and the methods of qualitative analysis of textual data share epistemological similarities. However, qualitative analysis does not fully benefit from the potential of NLP. In particular, works aiming at an actual automation of qualitative data coding remain quite rare. This thesis aims at investigating the potential of different NLP techniques for this purpose and for a task that requires a certain degree of human expertise. It aims at creating a tool that can be used in an industrial context and for a specific analysis method that allows to evaluate the acceptability of innovations. This method uses a codebook composed of 20 codes that have a higher semantic complexity than those traditionally used in computer-aided qualitative analysis.We explore ways to achieve this task through a bottom-up and then a top-down approach. For the former, we perform a lexicometric exploration on a corpus of old study data to define the lexical profile of the expected data for each code. Then, we treat the problem as a classification task by testing statistical classifiers of several types. We also investigate the possibilities offered by the projection of a syntaxico-semantic resource on the corpus.We then follow a less conventional top-down approach. For this one, we carry out an expert-informed modelling, in the form of an ontology, of the acceptability evaluation qualitative interview paradigm. This modelling is matched with a lexicon built in an ad hoc way. We thus propose an original architecture for a semantic analysis tool in which the ontology’s triples are used as a support for textual interpretation and which subsets constitute classification rules. We achieve building a hyperspecialized analysis tool which performances exceed those obtained by machine learning on our training corpus. This tool is carried to the point of operationalization, by being integrated into an autocoding platform, for the purpose of setting up a continuous learning process.

Source: http://www.theses.fr/2022GRALL002

.

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Releated Posts