Chelala, Jeremy
[UCL]
François, Thomas
[UCL]
Grâce au développement et à la démocratisation de l'internet au niveau mondial, l'accès à l'information devient, de nos jours, de plus en plus rapide et facile. Tous les jours ou presque, nous effectuons des recherches sur la toile pour obtenir des réponses à toutes sortes de questions, la plupart du temps avec succès. En effet, la quantité de données disponibles, tellement large et variée, garantit souvent un résultat satisfaisant. Mais cette masse d'information, si utile pour la connaissance, provoque paradoxalement une surcharge d'information : il y a tellement de contenu disponible qu'il devient impossible d'en traiter la majeure partie. Ce phénomène semble d'autant plus inquiétant que le nombre de données produites ne cesse de croître, proportionnellement à l'augmentation du nombre d'ordinateurs et d'ordiphones en circulation. On connait la rapidité et l'efficacité des ordinateurs à effectuer, pour l'homme, des tâches nombreuses et de plus en plus complexes. Dès lors, la machine ne pourrait-elle pas nous aider à mieux disposer de l'information, en la filtrant d'une quelconque façon ? C'est l'enjeu principal du résumé automatique de texte, un domaine du traitement automatique des langues et du traitement de l'information. Son objectif est d'arriver à produire un système capable de résumer un texte écrit en langue naturelle, c'est-à-dire de le condenser en reprenant l'essentiel de son contenu. À l'heure actuelle, aucun système de résumé capable de produire des résumés aussi qualitatifs que l'homme n'a vu le jour. Jusque récemment, la recherche ne se concentrait en effet que sur l'extraction des phrases les plus représentatives d'un texte, une sous-partie du problème du résumé. Pour produire automatiquement des résumés plus sophistiqués et plus utiles, il faut envisager d'autres techniques de réduction ou de remaniement de l'information que l'extraction de phrases. Parmi ces techniques, la compression automatique de phrases apparait essentielle. “Compresser une phrase” revient à la débarrasser de tous ses segments jugés inutiles dans un contexte donné, tout en conservant sa grammaticalité. Ce travail analyse, d'un point de vue à la fois théorique et expérimental, les différentes méthodologies en compression de phrases, spécifiquement pensées pour l'amélioration de résumeurs extractifs. Nous cherchons tout d'abord à comprendre de manière approfondie les besoins du résumé en matière de compression, en identifiant les limites théoriques et algorithmiques des systèmes d'extraction de phrases. Nous voulons également présenter les différentes façons d'implémenter l'interaction entre un compresseur et un résumeur automatiques. Nous souhaitons enfin montrer expérimentalement les résultats produits par les deux approches principales en compression automatique, et ainsi mieux cerner les difficultés et avantages de chaque méthode. Cela nous permettra de faire le point sur l'avancement des recherches dans les deux domaines du résumé et de la compression automatiques, et, finalement, d'envisager des solutions nouvelles, qui, à terme, rendront possible la production automatique de résumés exploitables par l'homme.


Bibliographic reference |
Chelala, Jeremy. La compression de phrases pour le résumé : approches automatiques pour des résumés plus qualitatifs. Faculté de philosophie, arts et lettres, Université catholique de Louvain, 2018. Prom. : François, Thomas. |
Permanent URL |
http://hdl.handle.net/2078.1/thesis:16967 |