Comprendre les Outils de Traduction : Moteurs, TAO et Mémoires

Classé dans Informatique

Écrit le en français avec une taille de 6,21 KB

Moteur de Traduction et Méta-Moteur : Définitions

Qu'est-ce qu'un moteur de traduction ?

Un moteur de traduction est un programme informatique qui, à partir d'un texte en langue source, produit une traduction automatique vers la langue cible.

Qu'est-ce qu'un méta-moteur de traduction ?

(Définition non fournie dans le texte original)

Moteur de Recherche vs. Moteur de Traduction : Les Différences

Qu'est-ce qu'un moteur de recherche ?

Un moteur de recherche est un programme informatique (ou robot) qui indexe toutes les pages accessibles sur les sites internet à partir d'une liste de mots-clés. Ces instruments de recherche fonctionnent sans intervention humaine, basés sur des robots qui parcourent les sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes qui relient les pages entre elles. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés. Il suffit de renseigner les expressions qui forment la requête, et le moteur de recherche déniche automatiquement les ressources correspondantes. Les résultats apparaissent organisés selon une logique propre à chaque moteur.

Qu'est-ce qu'un moteur de traduction ?

Le moteur de traduction, comme défini précédemment, est un programme informatique qui, à partir d'un texte en langue source, produit une traduction automatique vers la langue cible.

La différence clé

La différence fondamentale est la suivante : un moteur de recherche fournit des informations pertinentes en réponse à des mots-clés, tandis qu'un moteur de traduction restitue la même information que celle introduite, mais dans une langue différente.

Logiciel de Traduction Assistée par Ordinateur (TAO)

La Traduction Assistée par Ordinateur (TAO) est un domaine qui se situe à la croisée de la traduction et de l'informatique. Elle est un sous-domaine de la traductique, qui regroupe l'ensemble des outils informatiques utilisés par un traducteur, tels que :

  • Le traitement de texte
  • Les outils terminologiques
  • La traduction automatique

Ces logiciels sont dits à mémoire de traduction, car ils tirent parti de la récurrence de mots, tournures et phrases dans un document pour assurer une cohérence terminologique et syntaxique dans la traduction. Outre les mémoires de traduction, ces logiciels peuvent comporter d'autres fonctions destinées à faciliter le travail du traducteur :

  • Intégration d'outils terminologiques
  • Isolement du texte de sa maquette
  • Outils de révision

Wordfast Anywhere : Fonctionnalités et Utilité pour Traducteurs

Wordfast Anywhere permet aux traducteurs d'utiliser un logiciel à mémoire de traduction sans installation préalable. Le navigateur internet donne accès aux mémoires, aux glossaires et à tous les fichiers du projet à traduire.

Ces données sont stockées sur le serveur de Wordfast de façon totalement sécurisée et confidentielle (ce qui n'est pas toujours le cas avec des outils comme Google Translator's Toolkit, par exemple).

Wordfast propose également aux traducteurs d'exploiter un moteur de traduction pour les segments non reconnus, à l'instar de solutions comme SDL Trados.

En outre, Wordfast Anywhere facilite le partage de la mémoire de traduction en cours d'utilisation. Ainsi, plusieurs traducteurs indépendants peuvent travailler en équipe, chacun depuis son domicile, et bénéficier des travaux des autres membres de l'équipe.

Et tout cela, gratuitement, là où les principaux concurrents (comme SDL ou DéjàVu) vendent très cher leurs versions « Serveur ».

Mémoire de Traduction : Structure, Formats (XML, TMX)

Définition d'une mémoire de traduction

Une mémoire de traduction est une base de données dans laquelle chaque segment déjà traduit est enregistré avec son équivalent traductionnel dans la langue cible.

C'est un ensemble d'unités textuelles (segment, phrase, paragraphe) en langue source et langue cible. Elle permet à un logiciel de traduction assistée par ordinateur (TAO) de traduire un nouveau segment (S) en y cherchant une combinaison de segments ou sous-segments qui s'en rapproche le plus.

Formats de mémoire de traduction

Format XML

Le format XML (eXtensible Markup Language) est une variété du HTML, utilisé pour sa compatibilité et sa lisibilité sur différents systèmes informatiques.

Format TMX

Le format TMX (Translation Memory eXchange) est un format universel pour l'échange de mémoires de traduction. Une mémoire de traduction peut s'exporter très facilement d'un logiciel de TAO sous ce format, permettant ainsi son utilisation par d'autres traducteurs ou logiciels de TAO.

Structure d'un fichier TMX

La structure d'un fichier TMX est hiérarchique (comme des poupées russes), organisée en blocs : <tmx>, <header>, <body>.

Dans le <body>, on trouve des unités de traduction (<tu>). Chaque <tu> contient les segments source et traduit. Des paramètres peuvent y être ajoutés, comme un identifiant (ex: tuid="0001") ou la date.

À l'intérieur de chaque <tu>, on trouve deux segments <tuv> (Translation Unit Variant). Chaque <tuv> contient la balise <seg> (segment).

Dans le <seg>, on peut trouver des caractères non standard. L'encodage UTF-8 permet à tous les programmes de lire correctement ces caractères.

Exemple de structure TMX


<tu>
  <tuv>
    <seg>.....</seg>
  </tuv>
  <tuv>
    <seg>....</seg>
  </tuv>
</tu>

Entrées associées :