Qu'est-ce que l'API Google Cloud pour TTS (Text to Speech)?

Question

Dans mon application Web, j'essaie d'appeler pour envoyer une requête HTTP à une API Google qui prend du texte (tel que "Hello World") et renvoie un fichier MP3 avec l'équivalent vocal.

J'ai vu cette question: Google text to speech tts api ne semble pas fonctionner . Et cette page google: https://cloud.google.com/translate/docs/ .

Et il y a beaucoup d'autres pages qui semblent obsolètes - il semblerait que cette fonctionnalité ait été supprimée par Google ou qu'elle soit sous un autre appel?

Je ne vois aucune documentation (comme dans Google Translate API https://cloud.google.com/translate/ ) sur la façon d'appeler l'api de Google pour TTS. J'ai un compte et une clé dans l'API cloud Google.

Merci Dan

Alex · Answer

Google Text-to-Speech est un lecteur d'écran application développé et disponible sur la plateforme Android. Il n'est actuellement pas disponible dans le cadre de Google Cloud Plateforme .

D'autre part, Google Traduire est divisé entre un site Web add-on et un application basé sur le Web, possédant une fonctionnalité appelée «Écouter». Cette fonctionnalité peut être utilisée pour jouer via audito la sortie de la traduction, mais il n’est actuellement pas possible de la télécharger au format MP3.

Il est important de ne pas confondre la traduction en nuage API disponible dans le cadre de la plate-forme Cloud et servant à traduire l'entrée text-based d'un langue pris en charge vers un autre.

Enfin, si ce type d’API est disponible dans Google Cloud Platform, vous pouvez envoyer un nouveau problème de demande de fonctionnalité sur ce problème public Google Suivi .

Hiroshi Ichikawa · Answer

Google vient de lancer API de synthèse vocale en nuage .

HABJAN · Answer

Google a récemment publié Google Cloud Text To Speech API.

.NET La version client de Google.Cloud.TextToSpeech est disponible ici: https://github.com/jhabjan/Google.Cloud.TextToSpeech.V1

Voici un exemple court d'utilisation du client:

GoogleCredential credentials = GoogleCredential.FromFile(Path.Combine(Program.AppPath, "jhabjan-test-47a56894d458.json")); TextToSpeechClient client = TextToSpeechClient.Create(credentials); SynthesizeSpeechResponse response = client.SynthesizeSpeech( new SynthesisInput() { Text = "Google Cloud Text-to-Speech enables developers to synthesize natural-sounding speech with 32 voices" }, new VoiceSelectionParams() { LanguageCode = "en-US", Name = "en-US-Wavenet-C" }, new AudioConfig() { AudioEncoding = AudioEncoding.Mp3 } ); string speechFile = Path.Combine(Directory.GetCurrentDirectory(), "sample.mp3"); File.WriteAllBytes(speechFile, response.AudioContent);