Axe 3 : Typologie et dynamique des systèmes linguistiques

Responsable : Katharina Haude (Sedyl – Inalco)

 

Co-responsable: Dmitry Idiatov (Llacan – Inalco

eva-blue-SfPOkp6-2eA-unsplash.jpg

L’axe 3 étudie la diversité des langues du monde. La plupart de ses membres sont des linguistes de terrain possédant une solide expertise dans la description et la documentation de langues moins étudiées. La recherche qu’y est menée se concentre sur la typologie (c’est-à-dire l’étude des universaux et des différences que l’on trouve dans les langues du monde indépendamment de leur relation généalogique), ainsi que sur la variation dans l’espace et dans le temps entre des langues proches sur le plan géographique ou généalogique. Il s’agit d’analyses interlinguistiques approfondies de phénomènes linguistiques particuliers, ainsi que d’études sur les effets à court et à long terme des contacts entre langues apparentées et non apparentées.

 

De nombreux projets de l’axe 3 s’appuient sur les résultats de la première phase du LABEX-EFL, par exemple en utilisant les bases de données qui y ont été créées. Cette base empirique sera complétée par la création de nouvelles bases de données conçues pour l’analyse quantitative et qualitative, bénéficiant d’une expertise dans plus de 100 langues et familles de langues.

 

L’originalité de l’axe 3 réside dans l’interaction entre histoire de la linguistique, linguistique historique (reconstruction des macro-familles, changement typologique à long terme), linguistique de contact, documentation linguistique et typologie. Les recherches sont fondées sur des approches qualitatives et quantitatives (utilisation intensive de bases de données et de corpus électroniques pour évaluer des problèmes théoriques). L’interopérabilité croissante entre toutes ces ressources et le recoupement des hypothèses entre les différentes approches apporteront des perspectives scientifiques innovantes.

 

OPERATIONS DE L’AXE 3, LABEX-EFL 2020-2024

 

  1. GRAMMAR AND LEXICON IN SYNCHRONY AND DIACHRONY (GL)

 

GL1 Idéophones et interjections dans une perspective typologique, aréale et diachronique

Aimée Lahaussois, Yvonne Treis

 

GL2 La typologie lexicale dans le temps et l’espace

Alexandre François, Lameen Souag, Martine Vanhove

 

GL3 Associated motion and posture

Patrick Caudal, Guillaume Jacques

 

GL4 Typologie des systèmes flexionnels à inflexion non canonique

Enrique L. Palancar, Sebastian Fedden

 

GL5 La morphosyntaxe dans le discours

Katharina Haude, Tatiana Nikitina

 

GL6  Corpus de textes pour les langues mande

Valentin Vydrin

 

GL7  Reconstruction, généalogie, typologie et description grammaticale dans les deux plus grands phylums du monde : niger-congo et austronésien

Isabelle Bril, Alexandre François, Mark van de Velde

 

GL8  Grammaires étendues

Émilie Aussant

 

  1. VARIATION AND CONTACT (VC)
     

VC1  Langues, dialectes et isoglosses d’Asie occidentale

Pollet Samvelian, Anaïd Donabédian

 

VC2  Central Gallo-Romance : linguistique et écologie d’une zone de transition

Nicolas Quint

 

VC3 Variation syntactique dans les langues créoles

Stefano Manfredi, Nicolas Quint

 

VC4  Variation et contact de langues proches

Isabelle Léglise, Stefano Manfredi

 

VC5  Vers une typologie des alternances de langues

Isabelle Léglise

Présentation de l'Axe 3 en vidéo 

GL1 Idéophones et interjections dans une perspective typologique, aréale et diachronique

Aimée Lahaussois, Yvonne Treis

 

Nos objets d’étude sont les interjections et idéophones : classes de mots mineures,

invariables, et qui touchent au phonosymbolisme, en venant côtoyer la frontière entre langue arbitraire et motivée. Ces classes de mots ont été victimes, à travers l'histoire, de problèmes définitoires notables. En partant d’études de cas, le programme adoptera une perspective typologique, diachronique, aréale et multimodale sur l’analyse des idéophones et interjections, sur leur sémantique, morphologie et syntaxe.

 

 

 

 

 

GL2 La typologie lexicale dans le temps et l’espace

Alexandre François, Lameen Souag, Martine Vanhove

 

Ce projet se situe à la croisée de la typologie lexicale synchronique et de l’étude diachronique du changement sémantique. Il vise à examiner plusieurs domaines sémantiques dont l’organisation à travers les langues doit encore être cartographiée en détail, sous l’angle du changement historique. Pour atteindre cet objectif, nous étudierons les variations du lexique entre différentes langues, faisant apparaître des configurations récurrentes. Nous nous concentrerons sur un nombre limité de domaines sémantiques (mouvement, impact et manipulation, cognition), en utilisant des bases de données lexicales existantes, et en en créant une spécifiquement pour cette recherche. Comprendre la dynamique de la typologie lexicale est essentiel non seulement pour expliquer la stabilité des universaux statistiques, mais plus largement pour éclairer l’un des problèmes les plus épineux de la linguistique historique : la reconstruction sémantique.

GL3 Associated motion and posture

Patrick Caudal, Guillaume Jacques

 

Cette opération de recherche sera consacrée à la typologie de la posture associée et au mouvement associé, avec une emphase sur des typologies aréales dans différentes aires linguistiques (langues austronésiennes, australiennes, sino-tibétaines, Niger-Congo, en particulier). Posture associée et mouvement associé seront ici entendu dans le sens le plus large possible, i.e. comme allant de classes lexicales dédiées à des phénomènes spécifiquement grammaticaux – qu’ils soient liés à des particules, des clitiques, ou des affixes. Un intérêt tout particulier sera porté aux relations entre posture associée / mouvement associé et description des événements. Dans nombre de langues du monde, en effet, ces catégories sont liées par ex. à des systèmes de séries verbales, ou ont développé des rôles d’auxiliaires (notamment de temps ou d’aspect), etc.

 

 

 

 

GL4 Typologie des systèmes flexionnels à inflexion non canonique

Enrique L. Palancar, Sebastian Fedden

 

Le but de cette opération est de créer une meilleure connaissance typologique de la complexité flexionnelle dans les langues du monde par l’étude des phénomènes flexionnels non canoniques sur des nouvelles données provenant de langues moins décrites et en adoptant de nouvelles approches de données provenant de systèmes bien connus. L’objectif consiste à combiner des approches typologiques, formelles et quantitatives aux systèmes flexionnels. Des sujets empiriques d’intérêt particulier sont la flexion non-concaténative, le continuum entre synthèse et périphrase et l’émergence de la flexion non-canonique, aussi comme l’émergence de manque de flexion (« uninflectedness »).

 

 

 

 

GL5 La morphosyntaxe dans le discours

Katharina Haude, Tatiana Nikitina

 

À partir de corpus discursifs de langues généalogiquement et typologiquement distinctes, nous étudions les constructions grammaticales que les locuteurs utilisent spontanément pour décrire des événements – en particulier des événements impliquant deux ou plusieurs participants – dans un contexte plus large. Cela comprend l’analyse des changements de voix verbaux, la façon dont se réalize la référence aux participants à l’événement et l’ordre linéaire des éléments constitutifs de la phrase. De l’attention particulière sera accordée à des facteurs tels que l’animacité, la définitude ou la topicalité des référents du discours, ainsi qu’à l’emploi des catégories verbales (voix, aspect) utilisées pour diriger l’attention de l’interlocuteur.

 

 

 

 

GL6  Corpus de textes pour les langues mande

Valentin Vydrin

 

Cette opération, qui a débuté dans la première phase du LABEX, atteint un stade de maturité. Au cours de la première étape, les principaux outils électroniques nécessaires pour le fonctionnement des corpus parallèles, corpus annotés syntaxiquement et corpus audio, ont été développés. Ceux-ci faciliteront, d’une part, l’expansion et l’amélioration des corpus de textes existants et, d’autre part, la céation rapide de corpus de textes dans d’autres langues mande et éventuellement de langues d’autres familles.

Au cours de la nouvelle phase, l’accent sera mis sur les aspects NLP du projet, en particulier : désambiguïsation automatique (statistique) ; regroupement automatique des polysémies (sur la base d’une analyse vectorielle) ; développement d’outils OCR pour les langues concernées. En outre, les premiers essais de reconnaissance vocale et de traduction automatique seront effectués.

 

 

 

 

GL7  Reconstruction, généalogie, typologie et description grammaticale dans les deux plus grands phylums du monde : niger-congo et austronésien

Isabelle Bril, Alexandre François, Mark van de Velde

 

L’importance croissante des approches typologiques et évolutives dans la recherche des universaux linguistiques a renouvelé l’intérêt pour la classification des langues du monde, ainsi que pour la reconstruction de leurs proto-langues. Ce travail nécessite une analyse minutieuse du lexique et de la grammaire d’un grand échantillon de langues, fondée autant que possible sur des données de première main recueillies par des spécialistes. Notre projet vise à une meilleure compréhension de l’histoire et de la généalogie interne des deux plus grands phylums linguistiques du monde, à savoir le niger-congo et austronésien. En réunissant certains des meilleurs experts de ces familles, nous consoliderons la base empirique du travail comparatif dans ces phylums, à la fois en décrivant les langues individuelles, et en améliorant leurs classifications et généalogies. Dans chaque domaine de notre projet de recherche (description, classification et reconstruction), les spécialistes des familles austronésienne et niger-congo échangeront les méthodes et idées de leurs domaines respectifs.

 

 

 

 

GL8  Grammaires étendues

Émilie Aussant

 

L’histoire de la description des langues du monde peut être considérée comme une vaste entreprise d’adaptation plus ou moins réussie d’outils linguistiques initialement forgés pour décrire ou représenter une (très) petite poignée de langues : sur les milliers de langues que le monde connaisse, seules quelques-unes ont produit des outils linguistiques « réflexifs » (i.e. des outils qui décrivaient la langue dans laquelle ils avaient été composés) ; c’est le cas de l’arabe, du chinois, du grec et du sanskrit. Sous l’impulsion de Sylvain Auroux, un certain nombre de travaux ont été menés sur le transfert du modèle grammatical latin aux vernaculaires européens et à tout un ensemble de langues « exotiques » – phénomène qu’Auroux nommera la « Grammaire Latine Étendue ». Il s’agit à présent : 1) de documenter très largement les autres cas de « grammaires étendues » ; 2) de mettre à l’épreuve la commensurabilité de ces divers phénomènes de transfert ; 3) de mener une enquête minutieuse sur la terminologie linguistique pour mettre au jour son histoire longue et complexe.

 

 

 

VC1  Langues, dialectes et isoglosses d’Asie occidentale

Pollet Samvelian, Anaïd Donabédian

 

La configuration de l’Asie Occidentale est précieuse pour modéliser la notion d’aire linguistique et l’interaction dialectologie/contact/typologie. EFL présente des compétences internationalement reconnues (arménien, langues iraniennes) et des partenariats forts (grec d’Asie mineure, langues du Caucase, turciques, sémitiques), qu’il fédère en un pôle visible et innovant. Le prolongement de cette opération vise à :

  • Voir aboutir les résultats de la modélisation cartographique de l’aire

  • Explorer deux types de structures permettant d’approfondir à la fois les mécanismes fins du contact de langues dans l’aire West Asia et le degré de contrainte typologique lié à l’ordre OV en général dans les langues du monde 1) Ordre des mots et structure de l’information, et 2) Marquage différentiel des arguments

 

 

 

 

VC2  Central Gallo-Romance : linguistique et écologie d’une zone de transition

Nicolas Quint

 

Notre groupe de recherche a l’intention de développer une approche multidisciplinaire des variétés gallo-romanes du croissant linguistique, qui représentent un cas d’étude fascinant pour la linguistique de contact, car ces variétés présentent simultanément des caractéristiques oléagineuses et occitanes. Au cours de la période 2020-2024, un accent particulier sera mis sur les trois thèmes suivants : (i) le Croissant linguistique et son environnement (étude des variétés oléagineuses ou occitanes parlées autour du Croissant et des variétés régionales françaises parlées à côté des variétés du Croissant), (ii) vérification des corrélats non linguistiques (anthropologiques, historiques, etc) des isoglosses observées sur le terrain, (iii) développement des études psycholinguistiques consacrées au croissant. Dans l’ensemble, ce nouveau projet vise à proposer une approche globale, multidisciplinaire et écologique du Croissant linguistique.

 

 

 

 

VC3 Variation syntactique dans les langues créoles

Stefano Manfredi, Nicolas Quint

 

L’un des principaux problèmes dans la typologisation des structures syntaxiques sur la base de données (semi)spontanés est représenté par l’haut degré de variation individuelle affectant telles structures. Cela est particulièrement vrai pour les langues créoles dont les structures syntaxiques sont affectées pas différents processus de variation tels que l’interférence des langues du substrat/adstrat, le contact avec la langue lexificatrice ainsi que de la variation interne. Cette opération de recherche vise donc à intégrer l’analyse de la variation syntaxique dans les langues créoles avec la typologisation de différentes structures syntaxiques ainsi que à catégoriser les valeurs sémantiques et les sources de grammaticalisation des conjonctions de subordination et coordination.

 

 

 

 

VC4  Variation et contact de langues proches

Isabelle Léglise, Stefano Manfredi

 

Ce programme de recherche repose sur l’analyse fine des dynamiques de contact entre langues et variétés proches fondée sur des corpus hétérogènes (plurilingues, pluristylistiques, pluridialectaux). Il a pour ambition de proposer une typologie des variations en situation de contact et de revoir les notions de « frontières de langues » tout en prenant en compte les implications sociales du contact de langues.

 

 

 

 

VC5  Vers une typologie des alternances de langues

Isabelle Léglise

 

Ce programme de recherche étudie les alternances et contacts de langues grâce à l’analyse plurifactorielle de corpus plurilingues. Il a pour but, d’une part, de réaliser un examen critique de la typologie des termes proposés dans la littérature et, d’autre part, de proposer une typologie des alternances en prenant en compte un large éventail de situations et de contextes sociaux.