Sommaire:
I. Motivations de la demande
I.1. Le développement des études sémantiques est
probablement le fait le plus marquant de la période actuelle
au plan international. Il y a à cela plusieurs raisons :
a. Les études syntaxiques ont connu un essor considérable
dans les trente dernières années. Elles ont mis à
la disposition des chercheurs et des projets appliqués une réserve
considérable de méthodes, de relevés empiriques
et de formalismes. Cette grande richesse des investigations syntaxiques
proprement dites met à l'ordre du jour la question de la sémantique,
laquelle est toujours considérée par les modélisations
syntaxiques comme l'étape suivante, le recours, voire le but
ou la pierre de touche de la syntaxe.
b. La sémantique elle-même, sans s'éloigner de
la rigueur méthodologique qui depuis ses fondateurs Frege et
Montague lui assure une place au sein des disciplines scientifiques,
a élaboré depuis les années 80 des théories
et des formalismes destinés à assurer la flexibilité
et la couverture empirique requise par un traitement fin des données
linguistiques. Des éléments initiateurs très significatifs
de ce développement sont la généralisation du modèle
de la quantification (Lewis (1975), Barwise et Cooper (1980)), l'émergence
des théories dynamiques (Kamp (1981), Heim (1982)), et des re-délimitations
des domaines respectifs de la sémantique et de la pragmatique
(Asher (1993)).
c. Le domaine du Traitement Automatique du Langage, et même pour
des applications dont l'objet principal n'est pas le traitement de contenu,
reconnaît la nécessité de compléter les traitements
formels par des informations "sémantiques". En outre,
de plus en plus d'applications dans le domaine du dialogue homme - machine
exigent non plus seulement des informations sémantiques, mais
une modélisation d'ensemble du flux informationnel.
I.2. Si elle n'a jamais été absente de la communauté
française, la modélisation en sémantique a rencontré
en France un contexte spécifique qui dans les années 80-90
ne lui pas assuré le même essor que d'autres branches que
la discipline.
a. La philosophie du langage et l'enseignement de la logique n'ont
pas la même importance en France dans la formation des linguistes
que dans les pays qui ont joué un rôle de leader dans ce
secteur.
b. D'autres approches, connexes, ont absorbé les intérêts
et les énergies : développement de plusieurs courants
pragmatiques (théorie de l'argumentation de Ducrot, théorie
de l'interaction verbale, praxématique), investigations linguistiques
descriptives et théoriques concernant la linguistique de la référence,
ou la sémantique lexicale. Ces études constituent très
certainement un atout pour les années qui viennent, dans la mesure
où ces questions sont précisément celles dont la
modélisation est à l'ordre du jour, mais du point de vue
institutionnel, les deux facteurs qui précèdent expliquent
que si d'autres domaines de la discipline ont été assez
bien représentés et reconnus pour créer des équipes
CNRS propres (en syntaxe et en pragmatique par exemple), ceux qui aujourd'hui
travaillent en sémantique dans la communauté française
sont dispersés dans un grand nombre d'équipes différentes.
I.3. Or, les dernières années témoignent de potentialités
de développement remarquables dans le domaine de la modélisation
en sémantique émanant de différentes équipes
du CNRS, de l'Université et de grands établissements de
recherche.
a. Le nombre et l'activité des chercheurs français qui
travaillent dans ce secteur a connu un développement significatif
ces dernières années, considérablement renforcé
par les recrutements récents au CNRS. Citons ici simplement quelques-uns
des thèmes sur lesquels des chercheurs souhaitant se rattacher
à ce GDR ont acquis une visibilité dans la communauté
internationale : indexicalité, connecteurs, termes de polarité
et free-choice items, polysémie, indéfinitude/définitude,
mots en WH ; typage sémantique des entités, marqueurs
temporels et aspectuels, massif/comptable, sémantique du formatage
de l'information, traitement des pluriels ; et, en ce qui concerne les
théories ou formalismes : théorie des quantificateurs
généralisés, théorie des représentations
du discours, sémantiques dynamiques, grammaires formelles du
discours.
b. Les liens entre les chercheurs français du domaine et la plupart
des centres actifs dans le monde se sont considérablement renforcés
à la faveur de nominations, séjours de recherche ou projets
de coopération internationale. Ainsi, si on rassemble les contacts
de recherche forts qui unissent les chercheurs à l'origine de
ce GDR, on obtient une liste où figurent la plupart des centres
d'excellence internationaux du domaine et en particulier : Amsterdam,
Edinburgh, Stanford, MIT, Austin, Londres, Berkeley, Los Angeles, Sarrebruck,
Stuttgart, Utrecht, tel Aviv.
c. Un certain nombre de grands colloques et projet de recherche internationaux
dans les cinq dernières années ont contribué à
structurer une communauté française au contact de la recherche
internationale : le colloque de syntaxe et sémantique de Paris
(CSSP) , tenu depuis 1995 tous les deux ans, conférence internationale
sur la syntaxe et la sémantique formalisée, le colloque
de sémantique organisé à Paris par R. Zuber depuis
1996, le PICS Sémantique formelle et données du français,
Projet de coopération internationale CNRS- NWO (Pays-bas) financé
sur la période 1998-2001, et qui réunit une vingtaine
de chercheurs français et environ quinze chercheurs néerlandais.
d. L'existence de bases de données textuelles informatisées,
aujourd'hui prises en charge au CNRS par des équipes de recherche
soucieuses de les mettre au service de projets de recherche fondamentale,
offre à la sémantique de nouveaux champs de coopération
et d'investigation, et la possibilité de faire oeuvre originale
dans le domaine. On a trop dit, que la sémantique formalisée
ne s'occupait que de cas simples, sans rapport avec la complexité
des discours réels. Le propre des approches modélisées
dans un domaine comme la sémantique est de faire des prédictions,
donc de suggérer des modes d'investigation ou de validation en
principe implémentables sur de grands corpus. Mais il y a là
tout un travail à faire, dont les bases existent, et que la présente
demande de GDR vise à rendre possible en mettrant en relation
les équipes du CNRS qui sont en charge de l'évolution
de ces banques de données, et des chercheurs qui s'occupent de
mettre au point des modèles pour des observables empiriques.
I.4. Il existe donc un réel potentiel de recherches dans le
domaine de la modélisation en sémantique, aujourd'hui
dispersé dans des équipes différentes, et constitué
de jeunes chercheurs pour une bonne part. La forme du GDR est exactement
celle qui convient pour structurer le développement de ces recherches,
comme le CNRS l'a reconnu dans les années antérieures
en créant notamment des GDR en phonologie, morphologie et diachronie
du français. S'il est vrai que des bases communes et des liens
existent qui mettent à l'ordre du jour des efforts de ce type
pour fédérer ces recherches, il ne faut pas sous-estimer
en effet les risques liés à l'actuelle dispersion des
membres de cette communauté virtuelle. Le présent GDR
doit favoriser la confrontation critique des modèles et des analyses,
la circulation des idées entre des chercheurs dont l'environnement
est différent, et avant tout favoriser la discussion et l'ouverture
aux disciplines connexes. Ce sont ces préoccupations qui déterminent
la structure proposée pour ce GDR dont les axes principaux sont
la confrontation des modèles, les interfaces (internes et externes)
et la validation.
II. Objectifs généraux et opérations
thématiques
II.1. Objectifs généraux
Le GDR vise à mettre en relation des recherches en sémantique
qui ont une communauté de méthode et d'objectifs, mais
aussi leurs spécificités. L'énoncé d'objectifs
généraux qui suit vise avant tout à dégager
les points de synergie et d'échange envisagés. Dans la
tripartition des études linguistiques dessinées par Peirce,
la sémantique se préoccupe des relations des signes au
monde décrit et s'établit sur la notion de vérité-correspondance
dans l'optique de Tarski et Frege. Par modélisation, on entend
la construction d'architectures formelles explicites capables de traiter
les observations en les rendant intelligibles et de faire des prédictions
falsifiables. Si ce paradigme est bien reconnu, la nature même
du domaine de la sémantique linguistique n'a cessé d'être
redéfinie pour être conçue de manière beaucoup
plus large. Il y a tout d'abord une élaboration "interne"
du domaine initial, dont la manifestation la plus visible est l'élaboration
de la théorie de la quantification généralisée
et son application élargie aux phénomènes linguistiques.
L'intérêt est ici que de modèles de plus en plus
abstraits et de plus en plus généraux permettent des regroupements
sémantiques de données que les catégories de langue
et de grammaire séparent : indéfinis/définis, massifs/pluriels,
individus/événements.
Un des objectifs de ce GDR est d'évaluer cet élargissement
du modèle de la quantification. En effet, si toute une démarche,
d'ailleurs suivie d'une très riche postérité (cf.
infra), a été de fixer les limites de la quantification
restreinte pour la sémantique des langues, la quantification
généralisée oblige à poser le problème
autrement : une fois généralisée, la quantification
ne rencontre plus de problèmes d'adéquation empirique,
mais des problèmes d'adéquation et de précision
explicative. Le GDR a pour objectif d'explorer de manière critique
les vertus et limites des approches généralisantes des
catégories linguistiques en sémantique : par exemple,
qu'apporte la perspective du tout quantificationnel sur le traitement
des déterminants et quels sont les limites de cette perspective
; qu'en est-il des rapprochements entre la quantification sur les individus,
les événement et les mondes possibles, etc. ?
Mais il y a aussi un élargissement considérable de ce
qu'on considère aujourd'hui comme sémantique qui change
profondément les frontières traditionnelles. L'impossibilité
de rendre compte d'oppositions linguistiques pertinentes au moyen de
modèles vériconditionnels classiques a donné naissance
essentiellement aux sémantiques dynamiques, qui se concentrent
sur l'interprétation comme changement d'états d'information.
Mais au-delà, elles ont ouvert la porte à une modélisation
intégrée de phénomènes vériconditionnels
et de phénomènes ayant trait au " contexte de discours
". Ces derniers sont ancrés à des systèmes
d'inférence complexes à l'uvre aussi bien dans la
résolution des anaphores, la projection des présuppositions,
que l'attachement des contenus propositionnels à leur contexte
de discours par des relations rhétoriques. L'enrichissement des
modèles étant dès lors sans cesse à l'ordre
du jour, il est certain que la nature même des modèles,
les conséquences des enrichissements et la comparaison des alternatives
est une nécessité vitale pour maintenir à la modélisation
en sémantique la rigueur explicative et empirique qui la distingue
des discours ordinaires sur le sens. Le propre de la période
actuelle est que la modélisation passe à des choses de
plus en plus compliquées, et que les relations entre interfaces
internes et externes de la sémantique linguistique doivent être
sans cesse discutées.
Un but essentiel du GDR est de permettre une synergie entre des chercheurs
d'équipes différentes engagés dans la modélisation
de phénomènes complexes. Un trait commun de ces recherches
est la prise en compte du discours comme niveau de modélisation.
Il y a une grande richesse d'intérêts empiriques et de
points de vue sur le discours dans ces recherches, mais aussi une communauté
de paradigme telle que la communication et la discussion des travaux
particuliers permettent d'espérer des progrès pour chacun,
une meilleure visibilité de l'ensemble et la structuration d'une
communauté. Il s'agit aussi de mettre la question des interfaces
au premier plan. A l'intérieur de la linguistique, les interrogations
sur les interface sont cruciales. Les rôles respectifs de la syntaxe
et de la sémantique dans les grammaires est, comme on le sait,
un sujet de controverse et d'évolution des courants théoriques
des dernières années. L'étude de l'intonation,
d'autre part, a de plus de relations avec les représentations
sémantiques et cela est naturellement lié au fait que
la sémantique s'attache capter des relations contextuelles. La
sémantique lexicale, enfin, n'est pas un domaine séparable
de la modélisation plus large de la construction de la signification
en contexte : de nombreux débats actuels sur le typage des entités,
la nature compositionnelle de l'aspect et du temps se définissent
à l'interface de la sémantique lexicale et des modèles
de construction des représentations. La sémantique linguistique
n'est d'autre part pas a priori strictement disjointe de l'objet de
la philosophie du langage et des sciences cognitives, même si
son ancrage sur les langues et leur détail lui confère
des traits spécifiques. Le GDR a pour objet de permettre échange
et débats sur les objets respectifs des linguistes et des philosophes
et de favoriser la mise en relation des travaux. La sémantique
computationnelle offre aujourd'hui une manière particulière
de développer et tester des modèles dans leur phase de
conception, en leur donnant des implémentations dans des langages
logiques comme Prolog. Le GDR doit avoir dans ce domaine un objectif
de formation à l'intérieur et à l'extérieur
de ses membres.
Enfin, la communauté des linguistes intéressés
par la modélisation dispose aujourd'hui en France de bases de
données textuelles d'une grande richesse qui constituent un véritable
défi pour les disciplines telles que la sémantique modélisée,
dont la méthodologie privilégiée, on le lui a souvent
reproché, est celle du "fragment". L'objectif du projet
de GDR, est d'étudier la manière dont ces bases peuvent
servir à la validation de modèles en sémantique.
La participation au GDR de chercheurs de l'ATILF, tant sur le versant
informatique que sur le versant linguistique, est un élément
décisif pour entreprendre ce travail décisif.
II. 2. OPERATIONS THEMATIQUES
Le GDR sera structuré par les cinq opérations thématiques
suivantes.
III. Modalités de fonctionnement et financement
III. 1. Fonctionnement
Le GDR dans son ensemble sera coordonné par Francis Corblin,
assisté par David Nicolas.
Il aura pour implantation l'Institut Jean Nicod.
Chacun des responsables d'opération coordonnera l'opération
dont il a la charge.
Une séried'activités communes ou associant plusieurs opérations
seront régulièrement organisées.
Un site Web implanté à Jean Nicod permettra d'assurer
la visibilité des activités à l'intérieur
du GDR et la diffusion des informations.
1. SEMINAIRE MENSUEL DU GDR.
Un séminaire mensuel constituera le fil conducteur du GDR. Il
sera organisé par F.Corblin et D. Nicolas. Il a pour objectif
de rendre visible à l'ensemble des participants et plus largement
à la communauté les opérations conduites dans le
GDR et à inviter des personnalités scientifiques externes
(françaises ou étrangères) dont les travaux actuels
sont pertinents pour le séminaire.
2. ATELIERS DECENTRALISES
Chaque responsable de groupe organisera des séries d'ateliers
propres à assurer le développement et la visibilité
de son opération. Chaque membre du GDR dans son ensemble sera
tenu informé de toutes les réunions tenues par les opérations
et invité à s'y rendre s'il le souhaite.
3. JOURNEES d'ETUDE et COLLOQUES
Le GDR dans son ensemble et chacune des opérations sera invitée
à tenir des journées d'étude ou colloques ouverts,
permettant à une communauté plus large que celle du GDR
de présenter et de débattre de questions spécifiques.
Il proposera aussi sa collaboration pour organiser des ateliers ou sessions
parallèles dans les conférences organisées en France
dans laquelle la sémantique joue un rôle
4. CIRCULATION DES ETUDIANTS
Le GDR cherchera à faciliter la circulation des étudiants
en thèse dans le réseau qu'il constitue.
5. ECOLE D'ETE
Le GDR prévoit de tenir une école d'été
"Sémantique et sémantique computationnelle"
au bout de deux ans de fonctionnement. Cette école pourrait durer
une dizaine de jours. Elle associera un enseignement de sémantique
formelle et une initiation à l'implémentation de modèles
sur des fragments. Dans la mesure où la collaboration avec l'ATILF
le permettrait, nous envisageons également d'organiser une école
d'été pour former des utilisateurs à l'usage de
banques de données textuelles pour l'enseignement et la recherche
en sémantique
6. PUBLICATIONS
Chacune des opérations du GDR cherchera à contribuer à
des publications
- en recherche fondamentale: numéros de revues ou volumes
- dans le domaine de la formation des étudiants et chercheurs.
III. 2. Financement
Année 2001-2002: 140 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Equipement informatique: 30 KF
Livres logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF
Année 2002-2003: 150 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Equipement informatique: 20 KF
Financement partiel école d'été: 20 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF
Année 2003-2004: 140 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
financement colloque: 30 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF
Année 2004-2005: 150 KF
Frais de mission pour déplacements internes: 40 KF
Mobilité des doctorants: 20 KF
Frais d'invitation de collègues étrangers: 20 KF
Aide à publication: 20 KF
Livres & logiciels: 20 KF
Vacations de gestionnaire du site WEB: 10 KF
Financement partiel école d'été: 20 KF
[Cliquer ici]