Amazon AGI dévoile BASE TTS : un modèle intelligent d’auto-apprentissage

Une équipe de chercheurs d’Amazon AGI a révélé récemment le modèle BASE TTS, une avancée remarquable dans le domaine de la synthèse vocale intelligente. Ce modèle spécialisé dans la conversion de texte en discours a démontré sa capacité à perfectionner ses compétences de manière autonome, même dans des langues, symboles et expressions pour lesquels il n’a pas été spécifiquement entraîné.

Le processus d’entraînement du modèle impliquait une base de données massive comprenant 100 000 heures de discours humain dans diverses langues, dont 90% en anglais. De plus, des versions plus petites du modèle ont été entraînées sur 10 000 heures et 1 000 heures respectivement pour explorer ses capacités dans différentes conditions.

L’aspect le plus impressionnant de cette recherche est la capacité du modèle à comprendre comment prononcer des expressions exigeant une modulation subtile de la voix. Il a également montré sa maîtrise de la navigation entre les phrases et les clauses lors de la lecture de texte ponctué en anglais. Un autre point notable est la capacité du modèle BASE TTS à traiter avec succès certaines expressions françaises intégrées dans des phrases principalement en anglais.

Bien que le modèle soit actuellement en phase de recherche et développement, les chercheurs sont optimistes quant à son potentiel en tant que modèle de synthèse vocale auto-améliorant. Le BASE TTS appartient à la catégorie des « modèles diffusables », ce qui signifie qu’il n’effectue pas une conversion directe du texte en discours, mais fonctionne légèrement plus lentement. Les chercheurs continuent d’explorer des moyens d’améliorer l’efficacité de ce modèle prometteur, avec un accent particulier sur la rapidité d’exécution.

Cette innovation est une étape importante dans le développement des technologies de synthèse vocale, ouvrant la voie à des applications futures plus avancées dans divers domaines, de l’accessibilité aux services automatisés.

Laisser un commentaire