Quantifier la qualité des mémoires de traduction

Smartling a été élu vainqueur du concours World-Readiness Competition à TAUS : Massively Multilingual Conference. Voici comment Smartling ouvre la voie à la quantification de la qualité des mémoires de traduction.

Yext

Mei Zheng, Data Scientist chez Smartling, a été sélectionné comme lauréat du World-Readiness Competition lors de la TAUS Massively Multilingual Conference & Expo à San Jose, Californie, le 13 octobre 2022. Les participants ont été chargés de présenter une solution pour atteindre le dernier humains sur terre dans leur langue maternelle.

Découvrez comment Smartling propose de quantifier la qualité des mémoires de traduction !

Quelle est la mémoire de traduction ?

Les mémoires de traduction (TM) sont des fichiers constitués de paires de traductions précédentes qui ont été traduites dans le passé dans divers paramètres régionaux et types de contenu.

Pourquoi est-il important de quantifier la qualité des mémoires de traduction ?

Les traducteurs humains utilisent les mémoires de traduction comme point de départ pour leurs traductions grâce à des correspondances approximatives. Si une chaîne de correspondance floue élevée est associée à une traduction de faible qualité, cela réduit considérablement la productivité des traducteurs humains.

Du point de vue de la traduction automatique , le maintien d'une MT de haute qualité peut permettre à Smartling d'aider les clients à utiliser leur MT pour former des moteurs de traduction automatique personnalisés qui s'adaptent spécifiquement à la terminologie de leur marque.

Une MT de haute qualité signifie des économies de coûts et une traduction de meilleure qualité à long terme !

Défis actuels avec la mémoire de traduction

Les fichiers dans TM sont collectés au fil du temps et les utilisateurs ne savent souvent pas si les traductions sont toujours pertinentes. Si plusieurs fournisseurs de services linguistiques ou linguistes non vérifiés ont travaillé sur vos traductions dans le passé ou si des traductions automatiques se sont glissées dans votre MT sans le savoir, la qualité de votre MT pourrait rester discutable.

Problèmes existants avec les mémoires de traduction (MT)

Ne serait-il pas formidable s'il existait un moyen simple de quantifier la qualité des mémoires de traduction ?

Smartling a entrepris de créer un outil automatique capable de détecter les problèmes actuels de mémoire de traduction et d'évaluer automatiquement la qualité de la mémoire de traduction.

Comment noter la mémoire de traduction

Smartling adopte une approche en deux parties pour quantifier la qualité de la MT :

Pertinence

Lorsque nos clients utilisent notre TMS, nous pouvons collecter et utiliser les données suivantes :

  • Combien de MT ils utilisent pour leur traduction
  • Le pourcentage de leurs chaînes avec des scores de correspondance approximatifs élevés (plus de 90 % de correspondance)
  • Combien de correspondances répétées sur un texte source ils ont

Traductions

Du point de vue de la similarité sémantique, nous convertissons chacune des paires de traductions en vecteurs incorporés. Dans l'espace vectoriel 3D, nous pouvons calculer mathématiquement leurs similitudes cosinus. Plus le score est élevé, plus les paires de chaînes sont similaires en termes de signification.

Et du point de vue de la similarité textuelle - s'il y a une correspondance floue élevée, nous pouvons l'attribuer à la post-édition humaine. Maintenant que nous savons exactement quelle est la chaîne résultante, nous pouvons alors calculer le taux d'édition de la traduction (appelé taux d'édition post-traduction humaine). En calculant ce taux d'édition, nous pouvons alors connaître la qualité de la mémoire de traduction de nos clients.

Selon notre outil de notation TM basé sur ces méthodes, nous avons vu qu'en moyenne, une TM de haute qualité obtient 80,4 points et une TM de faible qualité obtient 53,8 points sur 100 points.

Cas d'utilisation/Applications pour quantifier la qualité de la mémoire de traduction

  • Utilisez les scores pour quantifier le pourcentage de pénalisation de MT spécifiques
  • Aidez les clients à filtrer automatiquement les mauvaises chaînes et à nettoyer leur MT
  • Un meilleur corpus pour la formation de moteurs de traduction automatique personnalisés

Smartling travaille à la transformation de ce prototype en un produit dans le cadre de notre offre de mémoire de traduction pour nos clients. Restez à l'écoute pour les nouvelles passionnantes!

En attendant, apprenez-en plus sur le hub de traduction automatique neurale de Smartling .