Degand, Liesbeth
[UCL]
Le point de départ de ma présentation seront les connecteurs causaux en français et en néerlandais et leur distribution dans des textes écrits. Dans nos recherches antérieures (Pander Maat & Degand, 2001; Degand & Pander Maat, 2003) nous avons montré sur base de corpus que des connecteurs tels que parce que, puisque, donc, etc. ont des profils distributionnels divergents. Pour déterminer ce profil, nous faisons appel à une conceptualisation scalaire des propriétés des connecteurs en termes d’« implication du locuteur » (IdL ou Speaker Involvement). Brièvement, l’implication du locuteur fait référence au degré avec lequel le locuteur joue implicitement un rôle actif dans la construction de la relation (causale). Notre hypothèse est que les différents connecteurs sont ordonnés sur une échelle allant d’une implication minimale du locuteur (relation objective: La plante est morte parce qu'on a oublié de l'arroser) à une implication maximale (relation subjective: On a dû oublier d'arroser la plante, car elle est morte). La place qu'occupe un connecteur sur l'échelle se reflète dans son comportement discursif, ce qui permet de faire des prédictions sur l'emploi des marqueurs. Ainsi, si le niveau d'IdL d'un connecteur est trop élevé ou trop bas pour un contexte discursif donné, il sera inapproprié. En travaillant avec des langues différentes, nous voulons vérifier notre hypothèse que l’échelle est constante, mais que les connecteurs divergent par les zones qu’ils occupent sur l’échelle. Ainsi, nous avons pu montrer sur base de corpus que les connecteurs causaux ne sont pas ordonnés de la même manière sur l'échelle d'IdL. En néerlandais l'ordre croissant en termes d'IdL est omdat < aangezien < want, alors qu'en français on trouve parce que < car < puisque. De plus, des connecteurs tels puisque et aangezien divergent radicalement quant à leurs contextes discursifs compatibles (Degand, à paraître). Pour tester nos hypothèses linguistiques, nous faisons appel à l'analyse (manuelle) d'exemples authentiques (en général 50 occurrences de chaque connecteur étudié). Après une présentation des résultats obtenus par le biais de cette méthode, j'aborderai la problématique du recueil et de l'interprétation de telles données dans les corpus. En effet, dans le cadre de nos recherches, nous avons été confrontés à un certain nombre de problèmes méthodologiques que nous voudrions soumettre à discussion. L'usage de corpus pour étudier la sémantique et l'usage des connecteurs n'est pas une approche nouvelle. Classiquement il s'agit soit d'analyses complètes de corpus relativement réduits, soit de vastes corpus dont des extraits sélectionnés aléatoirement sont analysés. Les raisons pour ces restrictions quantitatives sont claires: les analyses de données sont entièrement manuelles. Ces études empiriques sont bien sûr très utiles d'un point de vue qualitatif, mais elles souffrent toutes du même défaut quantitatif, à savoir la taille réduite de l'échantillon analysé (rarement plus de 100 occurrences, la plupart des cas 50). Par ailleurs, la plupart de ces analyses restent trop dépendantes de l'analyste, ce qui rend les généralisations et réplications difficiles. Pour pallier ces restrictions quantitatives, nous avons proposé d'implémenter les procédures d'analyse pour les rendre indépendantes de l'analyste et de les appliquer à des vastes ensemble de données, avec des centaines et même des milliers d'occurrences d'un même phénomène linguistique (Bestgen, Degand & Spooren 2003, soumis). Cela nécessite d'une part une série d'hypothèses linguistiques (provenant des études empiriques antérieures) et d'autre part une série de techniques de traitement automatique du langage, dans notre cas l'Analyse Sémantique Latente (Landauer, Folz & Laham, 1998) et l'Analyse Thématique de Textes (Popping, 2000). Dans la présentation, nous montrerons en quoi consiste cette implémentation et les résultats obtenus, nous aborderons ensuite les avantages, inconvénients et difficultés des différentes méthodes d'analyse.
Bibliographic reference |
Degand, Liesbeth. Connecteurs et implications du locuteur : analyses qualitatives et quantitatives..Colloque Perspectives croisées sur l’unité texte (Nicosie, du 18/03/2004 au 20/03/2004). |
Permanent URL |
http://hdl.handle.net/2078.1/137419 |