Vers un outil sémantique d’autocodage qualitatif pour l’évaluation de l’acceptabilité des innovations by Doriane Simonnet

juillet 7, 2020 Bibliographie e-commerce 0 Comment

<>div>

Thèse de doctorat en Sciences du langage Spécialité Informatique et sciences du langage

L'article aborde
Toggle
Résumé

Les techniques du Traitement Automatique des Langues (TAL) et les méthodes d’analyse qualitative des données textuelles entretiennent une certaine affinité épistémologique. Malgré cela, l’analyse qualitative ne profite pas pleinement des apports potentiels du TAL. En particulier, les travaux visant à une réelle automatisation du codage qualitatif des données restent somme toute assez rares. Cette thèse se donne pour ambition d’investiguer le potentiel de différentes techniques du TAL dans cet objectif et pour une tâche qui nécessite un certain degré d’expertise humaine. Elle vise à la création d’un outil utilisable dans un contexte industriel et pour une méthode d’analyse spécifique qui permet d’évaluer l’acceptabilité des innovations. Cette méthode mobilise une grille de 20 codes qui présentent une complexité sémantique plus élevée que ceux traditionnellement utilisés en analyse qualitative outillée.Nous explorons les moyens de parvenir à effectuer cette tâche à travers une approche ascendante puis une approche descendante. Pour la première, nous réalisons une exploration lexicométrique sur un corpus de données d’études anciennes afin de définir le profil lexical des données attendues pour chaque code. Puis, nous traitons le problème qui nous est posé comme une tâche de classification en testant des classifieurs statistiques de plusieurs types. Nous investiguons également les possibilités offertes par la projection d’une ressource syntaxico-sémantique sur le corpus.Nous suivons ensuite une approche descendante moins conventionnelle. Pour celle-ci, nous réalisons une modélisation experte du paradigme de l’entretien qualitatif d’évaluation de l’acceptabilité sous forme d’ontologie. Cette modélisation est assortie à un lexique construit de manière ad hoc. Nous proposons ainsi une architecture originale d’outil d’analyse sémantique dans laquelle les triplets de l’ontologie servent de support à l’interprétation et dont des sous-ensembles constituent des règles de classification. Nous obtenons un outil d’analyse hyperspécialisé dont les performances dépassent celles obtenues par le machine learning sur notre corpus d’entraînement. Cet outil est porté jusqu’à l’opérationnalisation, par son intégration dans une plateforme d’autocodage, en vue de la mise en place d’un processus d’apprentissage continu.

Titre traduit

Towards a qualitative autocoding semantic tool for the evaluation of the acceptability of innovations
Résumé

The techniques of Natural Language Processing (NLP) and the methods of qualitative analysis of textual data share epistemological similarities. However, qualitative analysis does not fully benefit from the potential of NLP. In particular, works aiming at an actual automation of qualitative data coding remain quite rare. This thesis aims at investigating the potential of different NLP techniques for this purpose and for a task that requires a certain degree of human expertise. It aims at creating a tool that can be used in an industrial context and for a specific analysis method that allows to evaluate the acceptability of innovations. This method uses a codebook composed of 20 codes that have a higher semantic complexity than those traditionally used in computer-aided qualitative analysis.We explore ways to achieve this task through a bottom-up and then a top-down approach. For the former, we perform a lexicometric exploration on a corpus of old study data to define the lexical profile of the expected data for each code. Then, we treat the problem as a classification task by testing statistical classifiers of several types. We also investigate the possibilities offered by the projection of a syntaxico-semantic resource on the corpus.We then follow a less conventional top-down approach. For this one, we carry out an expert-informed modelling, in the form of an ontology, of the acceptability evaluation qualitative interview paradigm. This modelling is matched with a lexicon built in an ad hoc way. We thus propose an original architecture for a semantic analysis tool in which the ontology’s triples are used as a support for textual interpretation and which subsets constitute classification rules. We achieve building a hyperspecialized analysis tool which performances exceed those obtained by machine learning on our training corpus. This tool is carried to the point of operationalization, by being integrated into an autocoding platform, for the purpose of setting up a continuous learning process.

Source: http://www.theses.fr/2022GRALL002

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Résumé

Titre traduit

Résumé

De nouveaux modes de vie aujourd’hui à de nouveaux récits pour demain : modalités d’adoption de la sobriété et dynamiques de socialisation aux comportements pro-environnementaux des jeunes éco-concernés by Sophie Lechartre

Système de détection de la fraude financière à l’aide d’approches et de techniques d’intelligence artificielle by Adamu Hussaini

Analyse et modélisation de l’impact environnemental du système d’information by Guillaume Bourgeois

Ne manquez pas nos prochaines news

Inscrivez vous !

MAIL

Liens utiles

Evénements

Proposez votre événement !

Vers un outil sémantique d’autocodage qualitatif pour l’évaluation de l’acceptabilité des innovations by Doriane Simonnet

Résumé

Titre traduit

Résumé

Releated Posts

De nouveaux modes de vie aujourd’hui à de nouveaux récits pour demain : modalités d’adoption de la sobriété et dynamiques de socialisation aux comportements pro-environnementaux des jeunes éco-concernés by Sophie Lechartre

Système de détection de la fraude financière à l’aide d’approches et de techniques d’intelligence artificielle by Adamu Hussaini

Analyse et modélisation de l’impact environnemental du système d’information by Guillaume Bourgeois

Ne manquez pas nos prochaines news

Inscrivez vous !

MAIL

Liens utiles

Evénements

Proposez votre événement !