Mémoires 2009-2010

  • 2010
  • La conception d'une ressource terminologique multilingue est l'aboutissement de phases successives, auxquelles participent terminologues, linguistes et développeurs, la mise en place d'un glossaire multilingue est un exemple de ces ressources, qui bien réalisé représente un gain en temps et en qualité pour le travail du traducteur.
    Un état de l'art des analyseurs morphologiques pour certaines langues, notamment pour l'arabe, nous fait apparaître que le défi de la racinisation et de la vocalisation est toujours d'actualité.

    2010
  • Les contes fantastiques présentent toujours un acteur du monde transcendant autour duquel tourne l'histoire et cette affirmation est d'autant plus vraie dans le cas des contes destinés à faire peur au public car cet acteur est, dans ce cas, la source première de l'angoisse. En effet, qu'il soit opposant ou adjuvant, l'acteur transcendant de tels textes inquiète l'auditeur contraint à se questionner quant à sa possible existence. Nous déterminerons donc quels traits marquent l'acteur transcendant dans ces textes et, par là même, une partie des mécanismes de propagation de l'angoisse dans les textes. Le choix des textes de notre étude se portera sur un genre particulier de textes de la tradition de littérature orale japonaise : le kaidan. Le choix des kaidan se justifie par le rôle de ceux-ci au sein de la culture japonaise. En effet, les kaidan sont des récits comparables à des contes mais leur but premier et avoué est principalement de s'amuser à se faire peur lors de réunions durant lesquelles les auditeurs se narraient successivement de tels récits. C'est donc tout naturellement que nous les avons choisis parmi le large panel de textes littéraires pour mener à bien cette recherche sur les mécanismes de la peur. Notons d'ailleurs qu'une précédente approche de ce genre littéraire, dans le cadre d'étude en langue et civilisation japonaise, a largement contribué à une meilleure compréhension de ceux-ci.Parmi ces kaidan et malgré les apparentes contradictions1, nous avons sélectionné les textes du recueil écrits en anglais par Patrick Lafcadio Hearn, alias Koizumi Yakumo2, qui présentent les avantages de l'authenticité et de l'homogénéité de la langue, les textes ayant été écrits à la même époque. Il est, en effet, le seul à s'être intéressé à la culture vernaculaire japonaise suite à la réouverture du Japon en 1853 et à avoir écrit un ouvrage sur le sujet des kaidan. D'autres textes en japonais parmi lesquels des traductions de certains textes du recueil de Lafcadio Hearn viennent étoffer ou compléter le corpus et montrent, par leur isolement, que la compilation de Lafcadio Hearn ne semble pas être ordonné de façon particulièrement significative. Les kaidan s'apparentent, en de nombreux points, aux contes merveilleux et fantastiques mais, contrairement aux contes, ils présentent très souvent des thèmes surnaturels dont les explications ou les éléments de réponses sont absents ou à tout le moins incomplets. L'absence d'informations ou la présence d'éléments inconnus contraint l'auditeur à des interrogations sans réponses qui sédimentent l'angoisse et à plus forte raison encore si elle se répète via la narration successive. Nous nous baserons sur cette hypothèse pour l'interprétation les résultats d'analyses sur nos corpus. Nous opterons donc pour une analyse du parcours interprétatif du genre textuel des kaidan dans l'optique de la constitution d'un système expert statistique avec des corpus étiquetés selon une méthodologie de sémantique interprétative. Notre objectif est donc d'étudier l'apparition de l'angoisse dans les kaidan et, pour ce faire, nous réaliserons un travail en trois étapes. Dans la première partie de cette étude, nous définirons, en 1.1, le genre littéraire des kaidan et, en 1.2, nous constituerons le corpus de référence ainsi que le corpus d'étude. Dans la deuxième partie, nous ferons le point sur les différentes méthodes en 2.1 et les outils informatiques utilisés pour l'analyse en 2.2 afin d'élaborer la méthodologie de travail. Enfin, dans la troisième partie, nous mènerons l'analyse du corpus à travers le corpus des 15 textes signés Lafcadio Hearn pré-analysé en 3.1 puis analysé en 3.2. En marge de ces objectifs principaux, mon objectif personnel était d'acquérir les notions nécessaires à la compréhension des approches linguistiques afin de concevoir des outils de textométrie et d'analyses qui soit en adéquation avec les besoins des analystes comme il m'a été donné de le faire en contexte entreprise au sein de la société Le Sémiopôle.

    2010
  • 2010
  • 2010
  • 2010
  • Les textes scientifiques regorgent d'assertions (hypothèses, conditions, possibilités) qui nuancent le discours et donnent plus ou moins de poids aux informations. Nous nous intéressons à l'identification des assertions portant sur la relation patient - problème médical dans les dossiers patients. Notre objectif est d'identifier automatiquement la certitude et les degrés de certitude contenus dans les énoncés des textes médicaux, ainsi que la polarité de ces énoncés (positive / négative). Nous avons travaillé dans le cadre du challenge i2b2. Pour ce faire, nous partons d'observations en corpus à partir desquelles nous définissons les ressources à utiliser. Nous avons choisi de constituer des listes de marqueurs morphologiques et lexicaux, ainsi que des patrons lexico-syntaxiques et sémantico-syntaxiques. L'application de notre méthode sur un corpus de test montre que les marqueurs permettent d'obtenir les meilleurs résultats en termes de rappel et précision. La contribution des patrons est faible. La condition et Yhypothèse s'avèrent être les deux catégories d'assertion les plus difficiles à identifier. La condition semble représentée essentiellement par des propositions subordonnées, et nous pensons que l'utilisation des fonctions syntaxiques permettrait d'améliorer les résultats pour cette catégorie. Vhypothèse en bénéficierait également, car ce type d'assertion est marqué en partie par des propositions subordonnées. Enfin, les listes de marqueurs doivent être enrichies à l'aide de synonymes.

    2010
  • L'étude des entités nommées a suscité, depuis les années 90, la réalisation de nombreux travaux dans le domaine de l'extraction d'information, notamment suite à la septième conférence MUC (Message Understanding Conférence) de 1998, laquelle a intégré, Y extraction de relations entre entités nommées.
    À travers cette étude, nous proposons une méthodologie en deux phases, pour l'extraction des relations naissance, déplacement, contact, fusion, acquisition et direction, le tout, inscrit dans un cadre industriel. Après avoir présenté la problématique autour de laquelle s'articule notre étude, nous proposons dans le premier chapitre un état de l'art des différentes approches et méthodes d'extraction de relations entre entités nommées. Le chapitre qui suit porte sur la définition du concept d' « entité nommée », ses mentions et ses types. Dans le troisième chapitre, nous proposons une typologie de relations entre entités nommées. Dans le quatrième chapitre, nous abordons notre méthodologie et notre corpus d'acquisition. Le cinquième chapitre fait état des résultats de nos extractions, à travers l'utilisation des outils d'Arisem. Enfin, le sixième chapitre traite de l'évaluation des ressources construites pour extraire nos relations entre entités nommées.

    2010
  • De nos jours, les sociétés de traduction veulent adhérer de plus en plus à une norme de qualité. Pourquoi ? Pour être reconnues en tant qu'entreprise offrant des prestations de qualité auprès des clients.
    Une norme de qualité fixe et définit les exigences en matière de qualité de service. L'adhésion à une telle norme demande beaucoup d'investissement de la part d'une entreprise. En effet, cela demande du temps, l'utilisation de ressources matérielles ainsi que de ressources humaines. Une politique de qualité sert à traduire les attentes et besoins des clients que l'entreprise désire satisfaire et l'amélioration continue pour les fidéliser. La norme EN 15038 est la norme européenne relative aux services de traduction et c'est à cette norme que nous allons nous intéresser tout au long de ce mémoire. Cette dernière a été approuvée par le Comité européen de normalisation (CEN) et remplace toutes les normes nationales de traduction. Cette norme fournit une description et une définition du service de traduction dans son intégralité, c'est-à dire elle couvre le processus tout entier, de la demande du client à la livraison finale du « produit ». L'adhésion à cette norme modifie entièrement la structure d'une entreprise et en particulier la gestion de traduction qui est l'épine dorsale, le pilier d'une société de traduction.

    2010