François, Thomas
[UCL]
Billami, Mokhtar
[LIF - Laboratoire d'informatique Fondamentale de Marseille]
Gala, Núria
[LIF - Laboratoire d'informatique Fondamentale de Marseille]
Bernhard, Delphine
[UMB - Linguistique, Langues et Parole (LILPA)]
La lisibilité d'un texte dépend fortement de la difficulté des unités lexicales qui le composent. La simplification lexicale vise ainsi à remplacer les termes complexes par des équivalents sémantiques plus simples à comprendre : par exemple, BLEU ('résultat d'un choc') est plus simple que CONTUSION ou ECCHYMOSE. Il est pour cela nécessaire de disposer de ressources qui listent des synonymes pour des sens donnés et les trient par ordre de difficulté. Cet article décrit une méthode pour constituer une ressource de ce type pour le français. Les listes de synonymes sont extraites de BabelNet et de JeuxDeMots, puis triées grâce à un algorithme statistique d'ordonnancement. Les résultats du tri sont évalués par rapport à 36 listes de synonymes ordonnées manuellement par quarante annotateurs.
Bibliographic reference |
François, Thomas ; Billami, Mokhtar ; Gala, Núria ; Bernhard, Delphine. Bleu, contusion, ecchymose : tri automatique de synonymes en fonction de leur difficulté de lecture et compréhension.Conférence conjointe JEP-TALN-RECITAL 2016 (Paris, du 04/07/2016 au 08/07/2016). In: Actes de la conférence conjointe JEP-TALN-RECITAL 2016, Association pour le Traitement Automatique des Langues : Paris, France2016, p. 15-28 |
Permanent URL |
http://hdl.handle.net/2078.1/193885 |