Répondre intelligiblement
Jusqu’ici, nous avons vu comment transcrire des voix en texte et comment faire en sorte que la machine comprenne le texte envoyé. Il convient maintenant que la machine nous réponde en utilisant la voix. C’est l’objectif de Polly que nous allons étudier maintenant.
1. Comment la machine construit-elle sa réponse ?
Polly est un moteur de synthèse vocal qui prend un texte en entrée et le restitue sous forme audio en sortie. Polly accepte deux types d’entrées :
-
Un texte brut.
-
Un fichier SSML (Speech Synthesis Markup Language) version 1.1, tel que défini par la w3.org (https://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/). SSML est un langage à base de balises permettant de donner des indications de prononciation ou de ton à Polly. La liste des balises utilisables à ce jour se trouve ici : https://docs.aws.amazon.com/fr_fr/polly/latest/dg/supported-ssml.html.
Polly est capable de parler plusieurs langues, dont l’anglais, le français, l’allemand, entre autres, avec des accents différents, américain, britannique, français, canadien… La liste complète des langues et des accents est disponible à cette adresse : https://docs.aws.amazon.com/fr_fr/polly/latest/dg/SupportedLanguage.html. En fonction des langues et des accents, vous trouverez des voix féminines ou masculines, parfois les deux, parfois plusieurs choix pour chaque sexe. Il est important de noter que chaque...