multilinguisme

Recherche

自然语言处理曾长时间停留在单语应用,而当下纷繁交错的多语数码文件则给自然语言处理语言学家开阔了的新视野,同时更丰富了其科研前景。这一观念的转变反映在语言处理几个不同的层面, 从文字编码问题到数码文件形式和内容问题。我们的研究正是这些问题一个综合, 即从多学科的角度(语言,信息,文档)来对以上问题进行分析和处理。
因此,我们倡导的研究方案结合形态元素(文件结构,编码)和内容元素 (语义)这两个层面。这两个不可分离的层面既具有重大的理论意义, 又开拓了技术、教学及其他研究的范围。
多语言多媒体数码文件的性质是我们所面对的一项复杂课题, 其实质在于衡量这类文件所具有的应用前景。
问题1:多语现象的关键
1. 文字的编码,转码
该课题是CRIM/TIM科研组成立以来的基础研究之一. INaLCO学院内100种语言的编码、转码需求就足以证明该研究的意义。我们已开发了一些专用的编码/转码程序,包括特别针对阿拉伯语,西里尔语,希腊语以及非洲语言(如EVALDA,ATOS或ALPCU项目)... (阅读更多)
近几年的思考表明,针对多语现象,编码的多重多样性和应用的多样化等问题, 其解决方案在于对对象符号综合表现形式的运用。
数十年在多语种、多类文字背景下的研究,使我们从“文字即图形标志”这一定义发展认识到了另一复杂概念,即把文字作为虚拟对象(所有不同程度的属性)。

Aide au codage d'un dictionnaire morphosyntaxique

Nom: 
NC
Prénom: 
-
Année: 
2002
Résumé du mémoire: 

Ce mémoire présente une réflexion sur le moyen d’améliorer les procédures utilisées pour l’acquisition et le codage de données lexicales dans un contexte multilingue, au sein de la société Sinequa. Après une observation de l’état des procédures et des ressources en cours, une évaluation des problèmes et des besoins sera effectuée et plusieurs propositions seront envisagées à différents termes.

Construction de ressources terminologiques pour un traducteur automatique : une approche textuelle

Nom: 
NC
Prénom: 
-
Année: 
2002
Résumé du mémoire: 

Notre projet prend place dans une étude menée par EADS-CCR (Centre Commun de Recherche) pour le département de veille de EADS-LV (Launch Vehicles). Une des activités de ce département (SN/S) est la veille stratégique et technologique sur les produits, entreprises et pays concurrents dans le domaine des lanceurs. Dans le cadre de cette veille, le département utilise le logiciel de traduction automatique Reverso de Softissimo, notamment comme outil d'aide à la compréhension de documents russes. Notre travail a consisté à enrichir le dictionnaire utilisateur russe-français sur les lanceurs à partir de corpus de textes représentatifs de ceux que les veilleurs exploitent habituellement. Nous avons dans un premier temps constitué à l'aide de la plate-forme Xerox Terminology Suite une base de données terminologique trilingue (russe-anglais-français) que nous avons ensuite enrichie manuellement en reliant les termes par des relations de traduction. En parallèle de ce travail, nous avons réfléchi sur la problématique de la réutilisabilité des données terminologiques au sein de EADS et dans le milieu industriel en général.
 

Etude comparative de deux outils de TAO

Nom: 
NC
Prénom: 
-
Année: 
2003
Résumé du mémoire: 

Le service de traduction du Parlement européen est une structure unique qui présente des caractéristiques très spécifiques. En effet, il faut gérer un très grand nombre de couples de langues et les documents sont d'une diversité extrêmement grande. Les outils pour aider le traducteur dans sa tâche sont très nombreux et variés. C'est la traduction assistée qui se prête le mieux aux besoins internes des traducteurs. L'outil utilisé jusqu'à présent était le TWB de la société Trados. Cependant, un autre programme a été mis au point en interne et il est actuellement en phase finale de test. Le travail de recherche que j'ai effectué au sein de cette institution pendant mon stage consiste à confronter le TWB avec FUSE, le nouvel outil de traduction assistée mis au point par un informaticien interne. Dans mon étude je cherche à savoir pourquoi un outil généraliste tel que le TWB ne s'est pas montré totalement efficace pour certains documents et a nécessité la création d'un nouvel outil. S'agit-il d'une faille au niveau du programme lui-même (problème structurel) ou bien, est-ce dû au contexte dans lequel cet outil est utilisé (problème environnemental) ? A travers une étude comparative des performances de ces deux outils sur un type de document particulier j'essaierai de montrer les aspects positifs et négatifs de chacun d'eux.

Constitution d’un corpus bilingue aligné français-persan

Nom: 
NC
Prénom: 
-
Année: 
2003
Résumé du mémoire: 

Ce mémoire présente une méthode d’alignement de corpus parallèles. Nous utiliserons un corpus journalistique bilingue français-persan constitué à partir des numéros d’avril à septembre 2003 du Monde diplomatique. La première phase consistera à aligner deux corpus, paragraphe par paragraphe. Ensuite, nous procéderons à une évaluation des problèmes rencontrés et nous proposerons des critères permettant d’améliorer les performances de cette méthode.

Notre objectif est d’aligner deux langues de système graphique différent, en l’occurrence le persan et le français, et d’en présenter les limites et par la même occasion, les outils qui ont été utilisés pour mener à bien ce travail. Après une brève description de la structure du persan, nous tâcherons de décrire les différences morpho-syntaxiques par rapport au français. Et enfin, l’analyse des résultats de l’alignement permettra de mettre en lumière les difficultés et les complexités de notre démarche.

L'approche Knowledge Management en entreprise

Nom: 
NC
Prénom: 
-
Année: 
2004
Résumé du mémoire: 

 

L'expression du multilinguisme dans la gestion de l'information sur le net, cas de la cohabitation des langues de cultures et des langues congolaises

Nom: 
NZIENGUE-A-TOMBET
Prénom: 
-
Année: 
2008
Résumé du mémoire: 

Ce travail est une réflexion concernant la gestion d’une information commune sur un site internet multilingue, impliquant des langues de familles différentes.

Nous avons fait le choix d’une telle activité impliquant trois langues de grande culture (anglais, français, roumain) et trois langues congolaises (lingala, munukutuba et tsangui). Sachant que les deux premières langues congolaises ont des rapports d’influence réciproque avec le français du fait de la colonisation.

Nous tentons de répondre à la question de savoir, comment gérer une information commune sur un site internet multilingue, quand les langues en présence peuvent exprimer des paradigmes pour le moins différents ?<

Constitution d'une base de données terminologique pour un portail Intranet collaboratif

Nom: 
LEROI
Prénom: 
-
Année: 
2005
Résumé du mémoire: 

La terminologie et la constuction de ressources terminologiques sont des activités qui se développent de plus en plus dans les entreprises. Leurs applications sont diverses: capitalisation des connaissances, outils d'aide à la traduction...
Par ailleurs, les entreprises s'orientent vers la mise en place de pratiques collaboratives et de communautés de pratique pour faciliter la communication interne.
Le travail présenté dans ce mémoire a donc tenté d'aborder ces deux problématiques dans le cadre de la construction d'une base de données terminologique pour un portail Intranet Collaboratif dans une grande entreprise.

Comment construire cette terminologie?

Comment envisager sa maintenance et son évolution dans un contexte collaboratif?

Telles sont les questions qui ont été soulevées dans ce mémoire.

NTIC & éthiques: quelle valeur posséde l'information en ligne ?

Nom: 
GAREON
Prénom: 
-
Année: 
2005
Résumé du mémoire: 

L'avénement de la société de l'information redéfinit l'économie en une 'nouvelle économie' numérique. L'entreprise doit apprendre à communiquer différemment pour profiter des opportunités commerciales que lui offre le Web. Le consommateur, quant à lui, ne se contente plus de subir l'information en spectateur passif.

Les outils de recherches 'moteurs de recherche en téte' ont remplacé les documentalistes et sont aujourd'hui plébiscités. Les modéles économiques qui y sont rattachés introduisent des biais supplémentaires dans la recherche et le traitement de l'information par le consommateur final.

Syndiquer le contenu