La puissance de l’IA dans la traduction : les percées de Smartling en matière de R&D

Découvrir le potentiel de l'intelligence artificielle avec la boîte à outils de traduction de l'IA de Smartling23mai2024

Yext

L’IA générative est au cœur des préoccupations depuis près de deux ans. Aujourd’hui, les dirigeants de tous les secteurs et fonctions demandent à leurs équipes de trouver des moyens de l’utiliser pour réduire les coûts ou augmenter l’efficacité. Mais la question est de savoir si l’IA fonctionne réellement dans la traduction ?

Au cours des 18 derniers mois, Smartling a concentré ses efforts de recherche et développement sur la recherche d’une réponse. Plus précisément, nous voulions savoir si l’IA pouvait nous aider à fournir une solution de traduction avec la meilleure qualité, le meilleur coût, la meilleure vitesse et la meilleure expérience au monde.

La réponse ? Un oui retentissant ! L’IA fonctionne et elle fonctionne à grande échelle. Mais toutes les candidatures ne sont pas gagnantes.

Où l’IA travaille-t-elle aujourd’hui dans la traduction ?

Lorsque les grands modèles de langue (LLM) sont sortis pour la première fois, les entreprises ont commencé à les tester en remplacement direct de la traduction automatique. Cependant, bien que ce cas d’utilisation ait du potentiel, il reste encore quelques problèmes à résoudre pour garantir des performances constantes.

Notre équipe de R&D a évalué plusieurs LLM et Traduction automatique sur plusieurs métriques de langue et de qualité (c’est-à-dire BLEU, MQM, TER, etc.). Cette expérience a montré qu’en utilisant les LLM pour la traduction dans toutes les langues, les mesures d’évaluation automatisée de la qualité indiquaient que les moteurs de traduction automatique surpassaient toujours les LLM en matière de qualité de la traduction. De plus, la traduction automatique est une approche beaucoup plus abordable pour la traduction que l’utilisation de LLM.

Bien que les LLM ne soient pas encore l’option optimale pour la traduction, notre équipe a commencé à les voir briller dans la post-édition et l’évaluation automatiques des résultats de Traduction automatique. Plutôt que de remplacer Traduction automatique, l’IA s’avère être un ajout puissant à Traduction automatique.

En particulier, les éléments suivants s’avèrent être des applications solides pour l’IA :

  • Réparation de correspondance floue
  • Insertion de termes de glossaire
  • Modifier l’estimation de l’effort
  • Formalité
  • Élimination des préjugés sexistes

Forts de ces connaissances, nous avons commencé à développer et à déployer de nouvelles solutions d’IA pour nos clients. Tout a commencé avec AI-Powered Human traduction, une solution de traduction qui réunit les linguistes experts de Smartlinget la technologie de l’IA pour fournir une traduction de haute qualité à moitié moins cher et deux fois plus rapidement.

Ensuite, les clients ont commencé à nous demander s’ils pouvaient utiliser nos fonctionnalités d’IA avec leur prestataire de services linguistiques tiers. Alors nous avons dit oui.

Présentation de la boîte à outils de traduction de l’IA

SmartlingAI traduction Toolkit offre une suite de fonctionnalités de traduction IA conçues pour réduire considérablement les coûts de traduction et améliorer les performances des linguistes sans sacrifier la qualité. Nous mettons à la disposition de tous notre technologie d’IA qui a fourni des résultats incroyables à nos clients AIHT, notamment :

  • Réparation de match flou AI : Augmenter l’effet de levier de mémoire de traduction jusqu’à 35 points de pourcentage, ce qui entraîne une réduction substantielle des coûts et une amélioration de la qualité.
  • Insertion de termes dans le glossaire AI : Intégrez de manière transparente les termes de votre glossaire dans le contenu, garantissant l’exactitude contextuelle et grammaticale.
  • Modifier l’estimation de l’effort : Traduction de groupes basée sur l’effort attendu pour atteindre la qualité humaine. Les informations peuvent être utilisées dans notre automatisation workflow pour attribuer des segments à des linguistes spécifiques ou contourner complètement la révision humaine.

Plongeons dans chacune de ces fonctionnalités et les recherches qui les soutiennent.

Plongée en profondeur : Réparation des correspondances floues de l’IA

Aujourd’hui, l’utilisation de la mémoire de traduction est une pratique courante. Cependant, AI Fuzzy Match Repair pousse l’approche traditionnelle un peu plus loin en utilisant des LLM pour réparer et lisser des segments qui ne seraient généralement pas exploités pour réaliser des économies.

Par exemple, dans l’image ci-dessous, vous pouvez voir que le texte source et la mémoire de traduction ne sont séparés que d’un mot. Avec une mémoire de traduction normale, le texte source devrait généralement être entièrement retraduit. Mais, avec la réparation de correspondance floue, le LLM est capable d’identifier la différence et de fournir une traduction réparée. La traduction suggérée serait désormais éligible à des remises de correspondance approximative, ce qui donnerait aux clients plus de valeur de leurs mémoires de traduction et réduirait la charge de travail des linguistes.

Boîte à outils de traduction AI - AI Fuzzy Match Repair

Bien que dans le concept, cela semble être une fonctionnalité vraiment cool - notre équipe de R&D voulait s’assurer que cela fonctionnait. Plus important encore, ils voulaient s’assurer qu’il apportait une réelle valeur sous forme d’amélioration des coûts, de la qualité ou de la vitesse.

Pour ce faire, ils traduisent le même contenu deux fois - une fois avec la réparation de correspondance floue de l’IA activée et une fois avec celle-ci désactivée. Ils ont évalué les deux scénarios en fonction du HTER de la traduction de sortie et de la traduction humaine finale. Nous voulions voir combien de segments ne nécessiteraient aucune intervention humaine après la réparation des allumettes floues.

Résultats de la réparation des correspondances floues de l’IA

La recherche a révélé que la réparation des correspondances floues par l’IA augmentait les correspondances de mémoire de traduction jusqu’à 35 points de pourcentage et le faisait de manière assez cohérente dans toutes les langues. Cela signifie que les clients peuvent utiliser l’effet de levier de la mémoire de traduction pour une plus grande partie de leur contenu, ce qui entraîne une réduction substantielle des coûts et une meilleure cohérence.

Plongée en profondeur : Insertion de termes dans le glossaire de l’IA

Une autre pratique courante en traduction est l’insertion de termes de glossaire. L’approche traditionnelle consiste simplement à extraire et à remplacer les termes du texte source et cible par les termes pertinents du glossaire. Cependant, cela a tendance à introduire de nouveaux problèmes de fluidité lorsque ces termes du glossaire ne sont pas en accord avec le nombre numérique, les inflexions ou d’autres éléments grammaticaux de la phrase globale.

Avec AI glossaire Term Insertion, un LLM est utilisé pour « lisser » l’insertion du terme du glossaire, garantissant ainsi la précision contextuelle et grammaticale. Par exemple, dans l’image ci-dessous, vous pouvez voir que l’application traditionnelle du terme glossaire « publicación » a introduit une erreur grammaticale dans le segment global où l’adjectif associé a maintenant l’inflexion incorrecte (primer vs. primera). À l’aide d’un LLM, la forme adjective appropriée est insérée et l’erreur est éliminée.

AI Glossary Term Insertion

D’après nos recherches, les LLM peuvent avoir un impact énorme sur le nombre d’insertions morphologiquement correctes de glossaire. Lors des tests pour le contenu russe et espagnol, la fonction d’insertion de termes du glossaire AI a augmenté le nombre d’insertions correctes de 25 % et 17,5 % respectivement. C’est un contenu qui ne nécessite plus d’effort humain pour être réparé.

Approfondissement : Estimation de l’effort de modification

Notre technologie d’estimation de l’effort d’édition regroupe la traduction en fonction de l’effort attendu pour atteindre la qualité humaine. Tous les segments sont envoyés avec notre invite propriétaire à un LLM qui évalue le segment en fonction de :

  • Exactitude grammaticale
  • Aisance
  • Cohérence sémantique
  • Précision lexicale
  • Contrôles de qualité
  • Guide de style (unique à chaque client)

Ces regroupements (niveau 1, niveau 2 et niveau 3) peuvent être utilisés dans workflowautomatisation dynamique pour traiter les segments en fonction de l’effort attendu. Par exemple, une entreprise peut attribuer un segment nécessitant des modifications importantes à des linguistes plus expérimentés ou contourner entièrement la révision humaine sur un segment nécessitant peu ou pas de modifications. Les clients peuvent également utiliser nos remises sur l’estimation de l’effort de modification pour créer des niveaux de remise pour les piqûres les plus performantes.

Modifier l’estimation de l’effort

Cela a le potentiel de fournir un temps et une réduction des coûts importants aux entreprises, en particulier à celles qui utilisent fortement le flux de travail de traduction basé sur l’humain. Cela permet également aux équipes de mieux comprendre leur processus de traduction.

Révolutionnez votre stratégie de traduction

Nous avons vu l’IA travailler pour étendre l’effet de levier, améliorer la précision de l’insertion des termes du glossaire, appliquer la formalité, etc. Cependant, il faut beaucoup de temps et de recherches pour identifier les endroits où l’IA peut être la plus efficace et offrir un fort retour sur investissement. C’est là qu’intervient l’aide d’un partenaire, comme Smartling, pour que vous n’ayez pas à le faire vous-même.

Un élément essentiel de notre stratégie est notre investissement dans la R&D pour nous assurer que nous sommes en mesure de fournir la solution LanguageAI™ la plus complète du secteur. Nous avons plusieurs brevets sur notre travail avec l’IA générative, et notre équipe d’ingénieurs a livré plus de 70 fonctionnalités ou améliorations majeures sur un nombre impressionnant de 3300 versions de production au cours de la seule année écoulée.

C’est ce qu’il faut pour vraiment s’assurer que les solutions d’IA offrent la meilleure qualité, le meilleur coût, la meilleure vitesse et la meilleure expérience au monde.

Apprenez-en plus sur nos dernières recherches et ce que nous explorons ensuite dans la sessionGlobal Ready Conference : Recherche révélée - maintenant à la demande.