Le Projet Initial

Demande de création d'un
Groupement de Recherche
2002-2005

 

Responsable : Francis Corblin
(Pr. Université Paris-Sorbonne Paris IV
Institut Jean Nicod, FRE 2335)


Sommaire:

I. Motivations de la demande
II. Objectifs généraux et opérations thématiques
III. Modalités de fonctionnement et financement
IV. Liste des projets de recherche et travaux des membres du GDR

 



I. Motivations de la demande

I.1. Le développement des études sémantiques est probablement le fait le plus marquant de la période actuelle au plan international. Il y a à cela plusieurs raisons :

a. Les études syntaxiques ont connu un essor considérable dans les trente dernières années. Elles ont mis à la disposition des chercheurs et des projets appliqués une réserve considérable de méthodes, de relevés empiriques et de formalismes. Cette grande richesse des investigations syntaxiques proprement dites met à l'ordre du jour la question de la sémantique, laquelle est toujours considérée par les modélisations syntaxiques comme l'étape suivante, le recours, voire le but ou la pierre de touche de la syntaxe.

b. La sémantique elle-même, sans s'éloigner de la rigueur méthodologique qui depuis ses fondateurs Frege et Montague lui assure une place au sein des disciplines scientifiques, a élaboré depuis les années 80 des théories et des formalismes destinés à assurer la flexibilité et la couverture empirique requise par un traitement fin des données linguistiques. Des éléments initiateurs très significatifs de ce développement sont la généralisation du modèle de la quantification (Lewis (1975), Barwise et Cooper (1980)), l'émergence des théories dynamiques (Kamp (1981), Heim (1982)), et des re-délimitations des domaines respectifs de la sémantique et de la pragmatique (Asher (1993)).

c. Le domaine du Traitement Automatique du Langage, et même pour des applications dont l'objet principal n'est pas le traitement de contenu, reconnaît la nécessité de compléter les traitements formels par des informations "sémantiques". En outre, de plus en plus d'applications dans le domaine du dialogue homme - machine exigent non plus seulement des informations sémantiques, mais une modélisation d'ensemble du flux informationnel.

I.2. Si elle n'a jamais été absente de la communauté française, la modélisation en sémantique a rencontré en France un contexte spécifique qui dans les années 80-90 ne lui pas assuré le même essor que d'autres branches que la discipline.

a. La philosophie du langage et l'enseignement de la logique n'ont pas la même importance en France dans la formation des linguistes que dans les pays qui ont joué un rôle de leader dans ce secteur.
b. D'autres approches, connexes, ont absorbé les intérêts et les énergies : développement de plusieurs courants pragmatiques (théorie de l'argumentation de Ducrot, théorie de l'interaction verbale, praxématique), investigations linguistiques descriptives et théoriques concernant la linguistique de la référence, ou la sémantique lexicale. Ces études constituent très certainement un atout pour les années qui viennent, dans la mesure où ces questions sont précisément celles dont la modélisation est à l'ordre du jour, mais du point de vue institutionnel, les deux facteurs qui précèdent expliquent que si d'autres domaines de la discipline ont été assez bien représentés et reconnus pour créer des équipes CNRS propres (en syntaxe et en pragmatique par exemple), ceux qui aujourd'hui travaillent en sémantique dans la communauté française sont dispersés dans un grand nombre d'équipes différentes.

I.3. Or, les dernières années témoignent de potentialités de développement remarquables dans le domaine de la modélisation en sémantique émanant de différentes équipes du CNRS, de l'Université et de grands établissements de recherche.

a. Le nombre et l'activité des chercheurs français qui travaillent dans ce secteur a connu un développement significatif ces dernières années, considérablement renforcé par les recrutements récents au CNRS. Citons ici simplement quelques-uns des thèmes sur lesquels des chercheurs souhaitant se rattacher à ce GDR ont acquis une visibilité dans la communauté internationale : indexicalité, connecteurs, termes de polarité et free-choice items, polysémie, indéfinitude/définitude, mots en WH ; typage sémantique des entités, marqueurs temporels et aspectuels, massif/comptable, sémantique du formatage de l'information, traitement des pluriels ; et, en ce qui concerne les théories ou formalismes : théorie des quantificateurs généralisés, théorie des représentations du discours, sémantiques dynamiques, grammaires formelles du discours.

b. Les liens entre les chercheurs français du domaine et la plupart des centres actifs dans le monde se sont considérablement renforcés à la faveur de nominations, séjours de recherche ou projets de coopération internationale. Ainsi, si on rassemble les contacts de recherche forts qui unissent les chercheurs à l'origine de ce GDR, on obtient une liste où figurent la plupart des centres d'excellence internationaux du domaine et en particulier : Amsterdam, Edinburgh, Stanford, MIT, Austin, Londres, Berkeley, Los Angeles, Sarrebruck, Stuttgart, Utrecht, tel Aviv.

c. Un certain nombre de grands colloques et projet de recherche internationaux dans les cinq dernières années ont contribué à structurer une communauté française au contact de la recherche internationale : le colloque de syntaxe et sémantique de Paris (CSSP) , tenu depuis 1995 tous les deux ans, conférence internationale sur la syntaxe et la sémantique formalisée, le colloque de sémantique organisé à Paris par R. Zuber depuis 1996, le PICS Sémantique formelle et données du français, Projet de coopération internationale CNRS- NWO (Pays-bas) financé sur la période 1998-2001, et qui réunit une vingtaine de chercheurs français et environ quinze chercheurs néerlandais.

d. L'existence de bases de données textuelles informatisées, aujourd'hui prises en charge au CNRS par des équipes de recherche soucieuses de les mettre au service de projets de recherche fondamentale, offre à la sémantique de nouveaux champs de coopération et d'investigation, et la possibilité de faire oeuvre originale dans le domaine. On a trop dit, que la sémantique formalisée ne s'occupait que de cas simples, sans rapport avec la complexité des discours réels. Le propre des approches modélisées dans un domaine comme la sémantique est de faire des prédictions, donc de suggérer des modes d'investigation ou de validation en principe implémentables sur de grands corpus. Mais il y a là tout un travail à faire, dont les bases existent, et que la présente demande de GDR vise à rendre possible en mettrant en relation les équipes du CNRS qui sont en charge de l'évolution de ces banques de données, et des chercheurs qui s'occupent de mettre au point des modèles pour des observables empiriques.

I.4. Il existe donc un réel potentiel de recherches dans le domaine de la modélisation en sémantique, aujourd'hui dispersé dans des équipes différentes, et constitué de jeunes chercheurs pour une bonne part. La forme du GDR est exactement celle qui convient pour structurer le développement de ces recherches, comme le CNRS l'a reconnu dans les années antérieures en créant notamment des GDR en phonologie, morphologie et diachronie du français. S'il est vrai que des bases communes et des liens existent qui mettent à l'ordre du jour des efforts de ce type pour fédérer ces recherches, il ne faut pas sous-estimer en effet les risques liés à l'actuelle dispersion des membres de cette communauté virtuelle. Le présent GDR doit favoriser la confrontation critique des modèles et des analyses, la circulation des idées entre des chercheurs dont l'environnement est différent, et avant tout favoriser la discussion et l'ouverture aux disciplines connexes. Ce sont ces préoccupations qui déterminent la structure proposée pour ce GDR dont les axes principaux sont la confrontation des modèles, les interfaces (internes et externes) et la validation.

 

II. Objectifs généraux et opérations thématiques

II.1. Objectifs généraux

Le GDR vise à mettre en relation des recherches en sémantique qui ont une communauté de méthode et d'objectifs, mais aussi leurs spécificités. L'énoncé d'objectifs généraux qui suit vise avant tout à dégager les points de synergie et d'échange envisagés. Dans la tripartition des études linguistiques dessinées par Peirce, la sémantique se préoccupe des relations des signes au monde décrit et s'établit sur la notion de vérité-correspondance dans l'optique de Tarski et Frege. Par modélisation, on entend la construction d'architectures formelles explicites capables de traiter les observations en les rendant intelligibles et de faire des prédictions falsifiables. Si ce paradigme est bien reconnu, la nature même du domaine de la sémantique linguistique n'a cessé d'être redéfinie pour être conçue de manière beaucoup plus large. Il y a tout d'abord une élaboration "interne" du domaine initial, dont la manifestation la plus visible est l'élaboration de la théorie de la quantification généralisée et son application élargie aux phénomènes linguistiques. L'intérêt est ici que de modèles de plus en plus abstraits et de plus en plus généraux permettent des regroupements sémantiques de données que les catégories de langue et de grammaire séparent : indéfinis/définis, massifs/pluriels, individus/événements.

Un des objectifs de ce GDR est d'évaluer cet élargissement du modèle de la quantification. En effet, si toute une démarche, d'ailleurs suivie d'une très riche postérité (cf. infra), a été de fixer les limites de la quantification restreinte pour la sémantique des langues, la quantification généralisée oblige à poser le problème autrement : une fois généralisée, la quantification ne rencontre plus de problèmes d'adéquation empirique, mais des problèmes d'adéquation et de précision explicative. Le GDR a pour objectif d'explorer de manière critique les vertus et limites des approches généralisantes des catégories linguistiques en sémantique : par exemple, qu'apporte la perspective du tout quantificationnel sur le traitement des déterminants et quels sont les limites de cette perspective ; qu'en est-il des rapprochements entre la quantification sur les individus, les événement et les mondes possibles, etc. ?

Mais il y a aussi un élargissement considérable de ce qu'on considère aujourd'hui comme sémantique qui change profondément les frontières traditionnelles. L'impossibilité de rendre compte d'oppositions linguistiques pertinentes au moyen de modèles vériconditionnels classiques a donné naissance essentiellement aux sémantiques dynamiques, qui se concentrent sur l'interprétation comme changement d'états d'information. Mais au-delà, elles ont ouvert la porte à une modélisation intégrée de phénomènes vériconditionnels et de phénomènes ayant trait au " contexte de discours ". Ces derniers sont ancrés à des systèmes d'inférence complexes à l'œuvre aussi bien dans la résolution des anaphores, la projection des présuppositions, que l'attachement des contenus propositionnels à leur contexte de discours par des relations rhétoriques. L'enrichissement des modèles étant dès lors sans cesse à l'ordre du jour, il est certain que la nature même des modèles, les conséquences des enrichissements et la comparaison des alternatives est une nécessité vitale pour maintenir à la modélisation en sémantique la rigueur explicative et empirique qui la distingue des discours ordinaires sur le sens. Le propre de la période actuelle est que la modélisation passe à des choses de plus en plus compliquées, et que les relations entre interfaces internes et externes de la sémantique linguistique doivent être sans cesse discutées.

Un but essentiel du GDR est de permettre une synergie entre des chercheurs d'équipes différentes engagés dans la modélisation de phénomènes complexes. Un trait commun de ces recherches est la prise en compte du discours comme niveau de modélisation. Il y a une grande richesse d'intérêts empiriques et de points de vue sur le discours dans ces recherches, mais aussi une communauté de paradigme telle que la communication et la discussion des travaux particuliers permettent d'espérer des progrès pour chacun, une meilleure visibilité de l'ensemble et la structuration d'une communauté. Il s'agit aussi de mettre la question des interfaces au premier plan. A l'intérieur de la linguistique, les interrogations sur les interface sont cruciales. Les rôles respectifs de la syntaxe et de la sémantique dans les grammaires est, comme on le sait, un sujet de controverse et d'évolution des courants théoriques des dernières années. L'étude de l'intonation, d'autre part, a de plus de relations avec les représentations sémantiques et cela est naturellement lié au fait que la sémantique s'attache capter des relations contextuelles. La sémantique lexicale, enfin, n'est pas un domaine séparable de la modélisation plus large de la construction de la signification en contexte : de nombreux débats actuels sur le typage des entités, la nature compositionnelle de l'aspect et du temps se définissent à l'interface de la sémantique lexicale et des modèles de construction des représentations. La sémantique linguistique n'est d'autre part pas a priori strictement disjointe de l'objet de la philosophie du langage et des sciences cognitives, même si son ancrage sur les langues et leur détail lui confère des traits spécifiques. Le GDR a pour objet de permettre échange et débats sur les objets respectifs des linguistes et des philosophes et de favoriser la mise en relation des travaux. La sémantique computationnelle offre aujourd'hui une manière particulière de développer et tester des modèles dans leur phase de conception, en leur donnant des implémentations dans des langages logiques comme Prolog. Le GDR doit avoir dans ce domaine un objectif de formation à l'intérieur et à l'extérieur de ses membres.

Enfin, la communauté des linguistes intéressés par la modélisation dispose aujourd'hui en France de bases de données textuelles d'une grande richesse qui constituent un véritable défi pour les disciplines telles que la sémantique modélisée, dont la méthodologie privilégiée, on le lui a souvent reproché, est celle du "fragment". L'objectif du projet de GDR, est d'étudier la manière dont ces bases peuvent servir à la validation de modèles en sémantique. La participation au GDR de chercheurs de l'ATILF, tant sur le versant informatique que sur le versant linguistique, est un élément décisif pour entreprendre ce travail décisif.


II. 2. OPERATIONS THEMATIQUES

Le GDR sera structuré par les cinq opérations thématiques suivantes.

1. Modèles et formats de représentation pour la sémantique
2. Les Modèles à l'épreuve des données
3. Les interfaces de la sémantique linguistique
4. Sémantique computationnelle
5. Sémantique et corpus

 

III. Modalités de fonctionnement et financement


III. 1. Fonctionnement

Le GDR dans son ensemble sera coordonné par Francis Corblin, assisté par David Nicolas.
Il aura pour implantation l'Institut Jean Nicod.
Chacun des responsables d'opération coordonnera l'opération dont il a la charge.
Une séried'activités communes ou associant plusieurs opérations seront régulièrement organisées.
Un site Web implanté à Jean Nicod permettra d'assurer la visibilité des activités à l'intérieur du GDR et la diffusion des informations.

1. SEMINAIRE MENSUEL DU GDR.
Un séminaire mensuel constituera le fil conducteur du GDR. Il sera organisé par F.Corblin et D. Nicolas. Il a pour objectif de rendre visible à l'ensemble des participants et plus largement à la communauté les opérations conduites dans le GDR et à inviter des personnalités scientifiques externes (françaises ou étrangères) dont les travaux actuels sont pertinents pour le séminaire.

2. ATELIERS DECENTRALISES
Chaque responsable de groupe organisera des séries d'ateliers propres à assurer le développement et la visibilité de son opération. Chaque membre du GDR dans son ensemble sera tenu informé de toutes les réunions tenues par les opérations et invité à s'y rendre s'il le souhaite.

3. JOURNEES d'ETUDE et COLLOQUES
Le GDR dans son ensemble et chacune des opérations sera invitée à tenir des journées d'étude ou colloques ouverts, permettant à une communauté plus large que celle du GDR de présenter et de débattre de questions spécifiques. Il proposera aussi sa collaboration pour organiser des ateliers ou sessions parallèles dans les conférences organisées en France dans laquelle la sémantique joue un rôle

4. CIRCULATION DES ETUDIANTS
Le GDR cherchera à faciliter la circulation des étudiants en thèse dans le réseau qu'il constitue.

5. ECOLE D'ETE
Le GDR prévoit de tenir une école d'été "Sémantique et sémantique computationnelle" au bout de deux ans de fonctionnement. Cette école pourrait durer une dizaine de jours. Elle associera un enseignement de sémantique formelle et une initiation à l'implémentation de modèles sur des fragments. Dans la mesure où la collaboration avec l'ATILF le permettrait, nous envisageons également d'organiser une école d'été pour former des utilisateurs à l'usage de banques de données textuelles pour l'enseignement et la recherche en sémantique

6. PUBLICATIONS
Chacune des opérations du GDR cherchera à contribuer à des publications
- en recherche fondamentale: numéros de revues ou volumes
- dans le domaine de la formation des étudiants et chercheurs.

III. 2. Financement


Année 2001-2002: 140 KF

Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Equipement informatique: 30 KF
Livres logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF

Année 2002-2003: 150 KF

Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Equipement informatique: 20 KF
Financement partiel école d'été: 20 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF

Année 2003-2004: 140 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
financement colloque: 30 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF

Année 2004-2005: 150 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Aide à publication: 20 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF
Financement partiel école d'été: 20 KF


IV. Liste des projets de recherche et travaux des membres du GDR

[Cliquer ici]