ChatGPT - un outil de traitement du langage naturel et un chatbot d'IA - a pris le monde d'assaut à la fin de l'année 2022. Il est toujours d'actualité à plus de la moitié de l'année 2023.
Dans tous les secteurs, on a beaucoup parlé des meilleurs cas d'utilisation, des limites du TPG et de l'impact qu'il aura au fur et à mesure que la technologie progresse. Ces discussions ont également lieu dans le secteur de la localisation. Voici ce que vous devez savoir sur la traduction GPT en tant que fournisseur de traduction automatique.
La GPT-4 peut-elle traduire le contenu ?
Le GPT (Generative Pre-trained Transformer) est un type de LLM (Large Language Model) fondamental qui peut générer du contenu dans plus de 90 langues, ainsi que traduire automatiquement des textes dans des dizaines de langues différentes. La dernière version de la famille GPT est le GPT-4.
Quelles sont les capacités du GPT-4 ?
GPT-4 est le modèle linguistique le plus avancé d'OpenAI à ce jour. Il a été entraîné sur des ensembles de données massives et utilise 1,7 trillion de paramètres, ce qui lui confère des connaissances générales étendues qui le rendent utile dans de nombreux secteurs. Il répond aux invites avec une plus grande précision que les versions précédentes et est également plus apte à apprendre et à imiter différents styles d'écriture. En outre, il peut traiter plus de 25 000 mots de texte, ce qui le rend plus adapté au travail sur des contenus longs.
Non seulement GPT-4 est meilleur pour les tâches générales que son prédécesseur GPT-3.5, mais il est également meilleur pour la traduction linguistique. Cependant, comme toute chose, cette technologie d'intelligence artificielle a ses limites.
Trois limites du GPT
Avant de vous lancer dans la traduction GPT, vous devez connaître certaines de ses contraintes.
1. Risque d'imprécision
Dans notre épisode de la série "Réalités" consacré au GPT et aux grands modèles linguistiques, Olga Beregovaya, notre vice-présidente chargée de l'IA et de la traduction automatique, a expliqué certaines contraintes liées aux modèles linguistiques à grande échelle. "Les modèles peuvent parfois avoir des hallucinations. Nous avons observé des inexactitudes factuelles et des phrases non pertinentes créées ou complétées par de grands modèles linguistiques."
En outre, Olga a souligné que les LLM "n'ont souvent pas conscience de ce qui se passe dans les realia des langues autres que l'anglais". Il existe un déséquilibre important entre la quantité de données en langue anglaise dont disposent ces modèles et la quantité de données en langues étrangères. Il en résulte des textes ou des traductions qui ne sont pas aussi pertinents sur le plan culturel qu'ils pourraient et devraient l'être".
Malgré cela, Olga a insisté sur le fait qu'il ne s'agit pas d'une raison pour éviter de déployer de grands modèles linguistiques tels que GPT. Tant que vous êtes conscient de ces limites et que vous les compensez, vous pouvez toujours utiliser GPT à votre avantage. Nous verrons comment un peu plus tard.
2. Préoccupations en matière de sécurité
Le GPT-4 apprend à partir des données de l'utilisateur (c'est-à-dire que l'historique de vos conversations permet d'entraîner le modèle). Même s'il existe désormais un paramètre permettant de désactiver cette fonction, OpenAI peut toujours consulter l'historique de vos conversations. Le GPT-4 sans garde-fou n'est pas un moyen sûr de traduire un texte contenant des informations sensibles. Vous feriez mieux d'utiliser un portail de traduction compatible GPT comme Smartling Translate, qui est alimenté par la plateforme LanguageAI™ de Smartling et traite les traductions dans un environnement privé et sécurisé.
3. Partialité de l'IA
Les grands modèles linguistiques tels que le GPT sont entraînés sur des ensembles de données qui reflètent les préjugés humains et, par conséquent, peuvent affecter les réponses et le contenu qu'ils génèrent. Par exemple, les moteurs de traduction automatique ont toujours été biaisés en faveur du sexe masculin, et des biais liés à la politique, à la race, à la profession, etc. existent également.
Il existe cependant des solutions à ce problème, qui ne feront que s'améliorer à mesure que des équipes comme la nôtre continueront à faire des progrès pour les surmonter. Actuellement, nous tirons parti de l'ingénierie des requêtes ciblées pour atténuer les biais dans les grands modèles linguistiques. Cela nous permet de les corriger dans le résultat de la traduction pour des cas d'utilisation spécifiques, ce qui rend la qualité de la traduction plus pertinente.
L'impact du GPT sur le secteur de la traduction
Hormis certaines limites, GPT a fait sensation dans le secteur de la traduction. Mais ce n'est pas ce à quoi beaucoup s'attendaient. Certains craignaient que l'essor de l'intelligence artificielle, y compris les LLMS et les moteurs de traduction automatique , ne mette les traducteurs humains au chômage. En réalité, leur rôle a changé.
Traditionnellement, les traducteurs effectuaient eux-mêmes la majeure partie du travail avec l'aide d'outils de traduction. Aujourd'hui, les LLM comme GPT, qui fait partie du Neural Machine Translation Hub de Smartling, peuvent effectuer le gros du travail, les traducteurs se chargeant davantage de l'ingénierie rapide et de la post-édition. Selon Olga, il existe désormais un "compagnonnage mutuel [entre les traducteurs et l'IA]". Le traducteur est à la fois "créateur de messages" et "validateur des résultats de l'IA".
Mais le rôle des traducteurs n'est pas le seul à évoluer. Les entreprises sont plus nombreuses que jamais à exploiter la puissance de la technologie de l'IA dans leurs solutions de gestion de la traduction.
Comment l'IA linguistique de Smartling utilise GPT-4 pour améliorer la qualité de 350%.
La plateforme LanguageAI de Smartling fournit instantanément des traductions de haute qualité, en utilisant la technologie GPT pour transformer le texte source et le texte cible. Lors du webinaire sur la technologie GPT, notre directeur principal des produits a montré comment l'utiliser pour corriger des erreurs techniques telles que des balises mal assorties, des espaces réservés ou des espaces blancs, et pour ajuster la formalité du texte source. Mais les outils de Smartling vont bien au-delà des pré-éditions.
Olga Beregovaya explique : "Là où les LLM brillent, c'est dans la post-édition automatisée et l'amélioration des traductions automatiques. Vous laissez donc le NMT faire ce qu'il sait faire - la personnalisation est beaucoup plus importante avec le NMT qu'avec les LLM. Ensuite, en utilisant les LLM pour le lissage, vous atténuez les risques d'inexactitude grammaticale, d'incohérences morphologiques, etc. Combiner le meilleur des deux mondes est en effet le moyen pour nous d'atténuer les problèmes potentiels.
C'est exactement ce que fait le Neural Machine Translation Hub de Smartling. Le NMT Hub utilise la sélection automatique pour choisir le meilleur moteur de traduction automatique pour votre contenu et votre paire de langues. GPT se chargera de lisser vos traductions. Vous obtiendrez ainsi des traductions d'une qualité jusqu'à 350 % supérieure à ce qu'un seul moteur de traduction automatique pourrait produire. Et ces traductions seront plus pertinentes pour votre marque. Notre président et fondateur, Jack Welde, l'a résumé ainsi lors de notre webinaire LanguageAI:
"Smartling peut intégrer le guide de style d'un client, son ton de voix, ses préférences en matière de genre et d'autres termes inclusifs, ainsi que sa base de données terminologique et son glossaire. [Il peut s'assurer que ces termes sont correctement utilisés et conjugués dans le résultat de la traduction automatique.
Pour voir de plus près comment Smartling y parvient, consultez cette brève démonstration de notre système de gestion des traductions. Il a été classé premier TMS d'entreprise pendant 15 trimestres consécutifs sur G2 !