web-dev-qa-db-fra.com

Comment convertir un discours déjà enregistré en texte?

Je cherche un logiciel qui me permettrait de saisir un fichier audio (.wav .mp3 ...) et d’envoyer le texte du fichier audio.

Un tel logiciel existe-t-il? J'ai seulement trouvé un logiciel qui convertit la voix (en direct) en texte, mais pas les fichiers audio en texte.

13
icu222much

Je ne sais pas que vous pouvez télécharger, mais je peux faire une suggestion maladroite.

Google a construit un tel logiciel, je sais qu'ils l'utilisent dans YouTube et Google Voice.

Ce n'est pas très bien , mais vous pouvez appeler votre compte Google Voice, laisser le répondeur répondre et écouter le son pendant l'enregistrement de votre messagerie vocale.

Vous recevrez une transcription de la boîte vocale dans votre courrier électronique.

Je suggère simplement cela parce que vous n'avez pas à former le moteur de Google.

3
Louis

Cela ne répond pas spécifiquement à votre question, mais dans votre cas, je le distribuerais comme un travail Amazon Mechanical Turk. Vous obtiendrez probablement les meilleurs résultats et paierez le moins de dollars possible.

2
Dennis Wurster

Vous pouvez ajouter le logiciel VOICENOTE (gratuit) à Google Voice. Cela convertit parler en texte. Ensuite, écoutez simplement l'enregistrement vocal de votre haut-parleur directement dans le microphone dans VOICENOTE.

Je prévois d’utiliser VOICENOTE pour transcrire mes notes écrites en texte et les enregistrer au format MS Word. Ensuite, lorsque j'enregistre un document, Windows peut rechercher mes notes manuscrites sur l'ordinateur. Sinon, les notes manuscrites ne peuvent être sauvegardées que sous forme d'image. Seuls les titres sont interrogeables et vous ne pouvez pas trouver les mots du document pour votre recherche.

1
Len

eMicrophones crée un produit commercial appelé Windows Speech Recognition Toolkit , qui ajoute de nombreux avantages à la reconnaissance vocale Windows, notamment la possibilité de transcrire des fichiers * .WAV (fournis). ils viennent de vous, c’est-à-dire un enregistrement comme si vous parliez, pas une voix arbitraire). De la liste des fonctionnalités:

La transcription lit les fichiers .WAV d'un enregistreur numérique et les transcrit en texte. Ceci est destiné à être utilisé par la personne qui a un profil d'utilisateur personnel et dicte comme elle le ferait devant l'ordinateur en utilisant une bonne énonciation et une bonne ponctuation. Il ne s'agit pas de transcrire plusieurs voix d'une réunion.

1
ckhan

Il existe un projet logiciel appelé 'fanscribe' qui décompose un enregistrement en plusieurs morceaux, en le distribuant aux personnes intéressées qui peuvent en retranscrire une partie.

https://github.com/fanscrib/fanscred/blob/master/README.rst

0
Dennis Wurster