Bolly, Catherine
[UCL]
Hempel, Susanne
[UCL]
La linguistique de corpus est envisagée ici comme s’inscrivant dans un continuum méthodologique où « intuition and data collection work hand in hand » (Partington, 1998: 1), où le souci d’exhaustivité et la finesse des descriptions qualitatives s’allient au potentiel de reproductibilité et de généralisation des analyses quantitatives. La méthode adoptée consiste en l’étude paramétrique et statistique de données de corpus. Comme le soulignent Degand & Bestgen (2004), elle a l’avantage de systématiser l’analyse qualitative, qui recourt traditionnellement à un traitement manuel des données, par le biais de l’opérationnalisation des hypothèses via un traitement semi-automatisé des données. Notre propos est de montrer comment nous avons pu appliquer cette méthode d’analyse de corpus particulière aux deux domaines de la phraséologie et de l’analyse du discours. Les corpus de référence sont respectivement un corpus de français contemporain langue première (400000 mots) pour l’étude phraséologique et le British National Corpus – World Edition (100 mio mots) pour l’étude discursive. Le même schéma méthodologique a été reproduit dans le cadre des deux études menées : 1) Constitution du corpus de départ 2) Préalable théorique : formulation des hypothèses de travail basées sur l’intuition du chercheur et examen des littératures existantes sur le phénomène linguistique étudié. 3) Élaboration de l’outil d’analyse : élaboration d’une liste paramétrique, en termes de variables, à partir des caractéristiques linguistiques retenues comme pertinentes lors de l’étude théorique ; extraction semi-automatique des données ; analyse des fragments de la concordance et encodage des données chiffrées obtenues par la confrontation du corpus avec les critères paramétriques. 4) Analyse statistique et interprétation des résultats : vérification/falsification des hypothèses de départ. La première étude s’est donnée pour objectif de mesurer le degré de figement (Gross, 1996 ; Mejri, 1997a) de 200 séquences verbo-nominales contenant le verbe à haute fréquence prendre. Nous proposons une hiérarchisation des séquences étudiées en fonction de la manière dont s’y combinent respectivement les contraintes syntaxiques, sémantiques et lexicales. L’analyse statistique a en outre permis d’examiner le type de corrélation pouvant exister entre ces contraintes, qui relèvent de plans langagiers distincts. La deuxième étude présente une analyse qualitative de l’utilisation concrète d’un groupe de marqueurs métadiscursifs organisationnels (Hyland, 1998, 2004), les ‘sequencers’, dans trois genres textuels différents. L’analyse statistique donne des résultats significatifs quant à l’utilisation respective des trois marqueurs (p < .001), et également des résultats hautement significatifs en ce qui concerne la distribution des différents ‘sequencers’ dans les trois genres textuels étudiés (p < .001).
Bibliographic reference |
Bolly, Catherine ; Hempel, Susanne. Application d'une même méthode d'analyse de corpus à deux domaines linguistiques distincts: Phraséologie et analyse du discours.4es Journées de la Linguistique de Corpus (Lorient, France, du 15/09/2005 au 17/09/2005). |
Permanent URL |
http://hdl.handle.net/2078.1/136831 |