Meta utilise les traductions de la Bible dans le but de préserver plus de 4 000 langues
Accueil » Actualités » Meta utilise les traductions de la Bible dans le but de préserver plus de 4 000 langues

Meta utilise les traductions de la Bible dans le but de préserver plus de 4 000 langues

L’équipe de l’IA affirme que les efforts sont soutenus par les éthiciens chrétiens, mais « il n’en va pas de même » pour le Coran et d’autres textes

En ce qui concerne les traductions de la Bible, nous pourrions être sur la bonne voie pour que l’Évangile soit prêché dans « toutes les langues ».

Meta, la société mère de Facebook et Instagram, a annoncé son intention d’utiliser la Bible et d’autres textes religieux pour traiter plus de 4 000 langues dans le but ultime de préserver ces langues.

Mais pourquoi l’Ecriture ?

Dans le cadre d’un effort de collecte de données pour son projet Massively Multilingual Speech (MMS), l’équipe de recherche sur la méta intelligence artificielle s’est tournée vers la Bible et d’autres textes religieux pour faire face à la perspective décourageante de collecter de telles données pour des milliers de langues, puisque les ensembles de données de parole existants actuellement plafonner à pas plus de 100 langues.

En se tournant vers la Bible, qui a été traduite dans le monde entier et partagée dans des enregistrements audio de ces traductions, les chercheurs ont pu créer un ensemble de données de lectures du Nouveau Testament dans plus de 1 100 langues couvrant en moyenne 32 heures de données dans chaque langue. .

Afin de couvrir les 27 livres et 260 chapitres du Nouveau Testament, Meta a utilisé les données de Bible.com, GoTo.Bible et FaithComesByHearing.com, y compris le texte original ainsi que des enregistrements audio.

L’équipe Meta AI s’est ensuite appuyée sur ce travail en utilisant « des enregistrements non étiquetés de diverses autres lectures religieuses chrétiennes », et bien que celles-ci soient principalement parlées par des locuteurs masculins, les chercheurs de Meta pensent que les modèles linguistiques « fonctionnent aussi bien pour les voix masculines que féminines ».

Les chercheurs ont également tenu des « consultations » avec des éthiciens chrétiens, qui, selon Meta, « ont conclu que la plupart des chrétiens ne considéreraient pas le Nouveau Testament et ses traductions comme trop sacrés pour être utilisés dans l’apprentissage automatique. « 

Ils ont également dit, cependant, que « ce n’est pas vrai pour tous les textes religieux : par exemple, le Coran n’était pas censé être traduit à l’origine ».

Le document a également souligné le précédent d’une telle utilisation de la Bible, citant l’effort CMU Wilderness de 2019 qui a créé des modèles de synthèse vocale pour près de 700 langues.

Le projet MMS, a déclaré l’équipe, « suit une longue ligne de recherche utilisant le Nouveau Testament pour former et évaluer des modèles d’apprentissage automatique ».

Le document de recherche a également noté un risque que les « données de formation religieuse » influencent et potentiellement même créent un biais pour les modèles linguistiques « par rapport à une vision du monde particulière », vraisemblablement liée à la Bible et au christianisme.

Cependant, l’équipe Meta AI a écarté le risque, ajoutant que le langage produit par les modèles « ne présente que peu de biais par rapport aux modèles de base formés sur d’autres domaines ».

En fin de compte, le projet, selon les chercheurs, est de préserver des langues qui pourraient potentiellement disparaître dans les années à venir.

« De nombreuses langues du monde sont en danger de disparition, et les limites de la reconnaissance vocale actuelle et de la technologie de génération de la parole ne feront qu’accélérer cette tendance », a déclaré l’équipe. « Nous envisageons un monde où la technologie a l’effet inverse, encourageant les gens à garder leur langue vivante puisqu’ils peuvent accéder à l’information et utiliser la technologie en parlant dans leur langue préférée. »

Malgré son ambition d’échelle sans précédent, ce n’est pas la première fois que l’IA est utilisée pour amplifier le message intemporel de la Bible.

En juin 2020, les créateurs de l’application de méditation chrétienne Soultime ont publié ce qui était alors la toute première version audio au monde de la Bible lue dans son intégralité par une voix d’intelligence artificielle. Le produit fini comportait 100 heures d’Écritures audibles.

Les développeurs de la société ont précédemment déclaré au Christian Post qu’ils « avaient évalué une gamme de plates-formes de synthèse vocale, mais avaient trouvé que Wavenet de Google était le son le plus naturel ». Mais « parce que le texte biblique est extrêmement complexe », les développeurs de l’application ont dû « travailler dur pour modifier la lecture de base afin de créer quelque chose qui semblait à la fois naturel et vraiment agréable à écouter ».