Lannoo, David
[UCL]
François, Thomas
[UCL]
(fre)
Dans ce mémoire, nous présentons une première version d'EFLSemLex, une nouvelle ressource pour l'apprentissage de l'anglais comme langue étrangère. EFLSemLex comprend des distributions de fréquence pour 14.662 mots attestés dans des textes de manuels experts et dans des ressources en ligne classés selon l'échelle du Cadre Européen Commun de Référence pour les Langues (CECRL). Fondamentalement, la ressource peut aider ses utilisateurs (des enseignants d'anglais L2, entre autres) à distinguer le type de vocabulaire qui devrait être compris par les apprenants de l'anglais à un niveau de compétence particulier. La particularité d'EFLSemLex, par rapport à la ressource graduée selon les niveaux CECRL pour l'anglais existante (EFLLex - Dürlich & François, 2018), réside dans l'aspect sémantique de la ressource. Au lieu d'identifier des distributions de fréquences pour les formes de mots, EFLSemLex établit des comptes de fréquences pour les sens des mots. L'identification des sens dans le corpus est permise par un algorithme de désambiguïsation lexicale automatique. En parallèle, ce travail propose une réflexion plus générale concernant les raisons pour lesquelles les ressources destinées aux apprenants d'une langue étrangère devraient prendre en compte le sens, en plus de la simple forme des mots.
(eng)
In this master’s thesis, we present a first version of EFLSemLex, a new resource for English as a foreign language. EFLSemLex includes frequency distributions for 14.662 words attested in expert-written textbook texts and online resources graded along the scale of the Common European Framework of Reference (CEFR). Fundamentally, the resource can help its users (EFL teachers, among others) to distinguish what kind of vocabulary should be comprehended by learners of English at a particular proficiency level. The particularity of EFLSemLex, as compared to the existing CEFR-graded resource for English (EFLLex – Dürlich & François, 2018), lies in the semantic aspect of the resource. Instead of identifying frequency distributions for word forms, EFLSemLex establishes frequency counts for word senses. The identification of word senses in the corpus is achieved by an algorithm of automatic word sense disambiguation. In parallel, this work offers a more general reflection on why resources aimed at learners of a foreign language should take senses into consideration, in addition to bare word forms.


Bibliographic reference |
Lannoo, David. EFLSemLex : une ressource lexicale graduée et désambiguïsée pour les apprenants de l’anglais en L2. Enrichir les ressources lexicales pour l’apprentissage des langues étrangères par la désambiguïsation lexicale. Faculté de philosophie, arts et lettres, Université catholique de Louvain, 2022. Prom. : François, Thomas. |
Permanent URL |
http://hdl.handle.net/2078.1/thesis:34841 |