Offre de thèse en linguistique informatique

Dernière mise à jour : mai 11


Le LabEx-EFL ( Laboratory of Excellence Empirical Foundations in Linguistics ) recrute un·e candidat·e pour un doctorat en linguistique informatique pour un contrat de 3 ans. Le poste est à temps plein avec un salaire net d’environ 1700 euros par mois et commence à partir de l’automne 2021. Le sujet s’inscrit dans le cadre de l’axe de recherche Computational Semantic Analysis du Labex EFL et sera supervisé par Benoit Crabbé et Timothée Bernard.

Sujet de thèse:


Supervision distante pour répondre à des questions sur les relations temporelles.


Ces dernières années, les méthodes à apprentissage profond ont permis une avancée claire pour réaliser les tâches d’inférence sémantique notamment en minimisant la quantité de données annotées. On propose dans cette thèse de tester les limites de ces méthodes sur une tâche de réponse à des questions sur les relations temporelles (avant, après, pendant...) entre des événements dans les textes. Par exemple, les questions peuvent être de la forme suivante : l'événement X se produit-il avant l'événement Y dans le texte ?


En général, l'inférence sur la structure textuelle est un problème pour lequel les données annotées sont notoirement coûteuses et difficiles à acquérir et le cas de la structure temporelle ne fait pas exception. La thèse s’appuiera sur des méthodes récentes qui minimisent le coût de l'annotation manuelle de relations temporelles et qui utilisent plutôt la tâche de réponse aux questions comme objectif principal. Nous étudierons de préférence des modèles interprétables, basés sur des graphes ou des lignes du temps, qui construiront leur propre représentation du texte afin de répondre aux questions.

De plus, nous voulons tester dans quelle mesure un modèle de question/réponse aux questions de bout en bout est capable d'acquérir et de tirer parti de sa propre représentation temporelle pour réaliser les inférences nécessaires pour répondre à des questions dans le cas où la réponse est laissée implicite dans le texte.

Nous étudierons dans quelle mesure les modèles de réponse aux questions demandent d’annoter explicitement les relations temporelles exprimées dans le texte ou dans quelle mesure nous pouvons laisser certaines ou toutes ces relations non spécifiées et plutôt utiliser la tâche d'inférence en aval afin d'acquérir la ligne du temps textuelle.

Profil recherché : Le ou la candidat.e doit avoir un diplôme équivalent à un master (avant novembre 2021), avec une spécialisation en intelligence artificielle, traitement automatique des langues ou linguistique computationnelle. On attend que les candidats aient des compétences substantielles en apprentissage profond ou en apprentissage par renforcement et un intérêt pour la modélisation.

Affiliation: Le ou la doctorant.e sera rattaché.e au Laboratoire de Linguistique Formelle (http://www.llf.cnrs.fr), un financement sera disponible pour les missions, ainsi qu’un accès à des serveurs de calcul. L’étudiant.e devra assister à des séminaires doctoraux, et pourra éventuellement assurer des cours au sein des formations en TAL/linguistique informatique à l’université de Paris.

Procédure pour candidater:

  • Le dossier de candidature doit être envoyé à benoit.crabbe@u-paris.fr et à timothee.bernard@u-paris.fr .

  • Date limite de candidature : 25 juin 2021 (minuit).

  • Le dossier doit être composé de :

  • une lettre de motivation ;

  • un CV incluant les cours suivis (notes de master), diplômes obtenus, éventuels stages ;

  • le nom et contact de deux références.

  • Les candidat.e.s présélectionné.e.s enverront leur mémoire de master et/ou d’autres travaux écrits montrant leur qualification pour le projet en question.

  • Les auditions (par vidéoconférence) des candidat.e.s présélectionné.e.s auront lieu début juillet 2021.

Contact : Pour des questions concernant la procédure de candidature, contacter benoit.crabbe@u-paris.fr