entités nommées

Identification des entités nommées dans un corpus français-anglais-arabe

Nom: 
NC
Prénom: 
-
Année: 
2002
Résumé du mémoire: 

Avec la montée en puissance des réseaux (Internet notamment), la taille des documents multilingues à traiter devient de plus en plus importante, ce qui augmente les besoins en outils de traitement automatique pour différentes langues. 
Parmi ces outils, beaucoup ont recours à la reconnaissance et l'extraction automatique des entités nommées : indexation automatique de documents, recherche d'information, traduction automatique, catégorisation, etc. 
Notre travail de stage consiste à repérer les entités nommées dans un corpus trilingue Anglais/Arabe/Français (non aligné) collecté à partir des ressources disponibles sur Internet. 
Dans notre mémoire, nous commencerons d'abord par la présentation d'un état de l'art pour passer en revue les récents systèmes développés pour la reconnaissance des entités nommées pour le Français et l'Anglais ayant notamment participé aux conférences MUC. Nous tenterons ensuite d'examiner ce qui a été fait pour le traitement automatique de l'Arabe et, si possible, ceux concernant l'extraction des entités nommées. Nous ferons ensuite le lien avec le travail réalisé durant notre stage et aborderons les difficultés rencontrées et les solutions mises en place pour les résoudre. 

EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2

Nom: 
GUILLAUME
Prénom: 
-
Année: 
2007
Résumé du mémoire: 

Le but de ce projet était d'automatiser l’extraction d’entités nommées en japonais afin de faciliter leur reconnaissance dans une autre langue et ce, dans le cadre d’un alignement textuel.
L'outil créé prend donc en entrée un couple de textes alignés japonais-langue2 et effectue l'extraction des entités en japonais. L'utilisation de l'unicode pour les traitements et l'affichage autorise l'utilisateur à choisir en langue2 la langue de son choix.
Un affichage sous forme de tableau html permet ensuite à l'utilisateur de visualiser les phrases japonaises contenant ces entités surlignées ainsi que les phrases équivalentes dans la deuxième langue.

Pistes méthodologiques pour l'acquisition de noms de personnes à partir du WEB

Nom: 
CHEVRIER
Prénom: 
-
Année: 
2005
Résumé du mémoire: 

L'acquisition de noms de personnes peut être nécessaire pour des applications en ingénierie linguistique.

Nous avons constitué un lexique de noms de famille de personnes norvégiennes pour un système de reconnaissance d'écriture à l'aide d'une méthode simple qui nous semble manquer de robustesse. Pour essayer de trouver des méthodes alternatives, nous avons étudié la tâche de reconnaissance des entités nommées et les systémes dédiés à celle-ci, ainsi que quelques méthodes d'acquisition d'entités nommées à partir du WEB.

Nous en avons tiré un certain nombre de pistes éventuellement exploitables pour constituer des listes de noms de famille de personnes habitant un pays donné.
Ces derniéres sont : l'utilisation de dictionnaires de prénoms, de listes de mots déclencheurs, d'informations de capitalisation et d'informations de formatage des documents HTML.

Syndiquer le contenu