web-dev-qa-db-fra.com

Reconnaissance de motifs audio open source (impression digitale)

Existe-t-il une solution open source d'empreintes digitales audio qui fournit une solution "similaire à Shazam"?

Shazam utilise la solution commerciale de Landmark digital mais je cherche une solution open source alternative (même si inférieure en précision et performance).

Quelqu'un sait-il une telle implémentation ou même un algorithme publié non implémenté?

25
Variant

d'accord. différents mots clés de recherche, tous les résultats que j'ai recherchés.

http://musicbrainz.org/doc/Audio_Fingerprint

Merci pour tous ceux qui regardent

9
Variant
  • echoprint ressemble à une alternative solide aux bibliothèques commerciales.

pour la reconnaissance vocale:

nous avons seulement testé echoprint et jusqu'ici tout va bien.

Je sais que la réponse est un peu tardive mais comme cette page apparaît dans google, nous pouvons aussi bien l'améliorer avec le temps :)

édité comme CMU est orienté vers la parole

20
teriiehina

Il existe quelques projets de reconnaissance audio Open Source, bien que vous puissiez oublier la qualité/les performances des services d'identification audio commerciaux tels que Shazam, SoundHound, etc. Cela dépend également du type de reconnaissance que vous souhaitez faire (empreinte digitale des fichiers audio/marquage, identification en temps réel, reconnaissance OTA (Over-The-Air), etc.)

Surce ouverte

  • AcoustID/MusicBrainz Fournit des outils pour effectuer les empreintes digitales audio et l'association des métadonnées (fingerprinter et serveur). Vous pouvez installer votre propre serveur d'empreintes digitales/métadonnées ou utiliser le service de MusicBrainz. Bonne solution pour la prise d'empreintes digitales et la reconnaissance de fichiers audio, ne convient pas aux applications hautes performances en temps réel (c'est-à-dire OTA). Nous l'avons également testé pour la surveillance du flux audio (surveillance de la diffusion) mais les résultats étaient assez médiocres.

  • Echoprint Fournit les mêmes outils que AcoustID (empreinte digitale et serveur + métadonnées) et peut également être utilisé pour la surveillance du flux audio car il peut reconnaître des extraits pris de n'importe où dans l'audio avec une précision décente (mais je ne le ferais pas l'utiliser pour des applications commerciales sérieuses). Ils affirment également qu'il convient aux applications OTA, mais les performances ne conviennent nulle part aux utilisations de production.

  • Last.fm Pas entièrement open source, bien qu'ils aient ouvert le module d'empreintes digitales. Vous devez interroger leurs services d'identification et de fournisseur de métadonnées car ils ne fournissent pas une solution complète.

12
aliantor

Si vous recherchez la bibliothèque Java alors optez pour MusicG, je l'ai utilisée dans mon projet précédent et son fonctionnement est correct. http://code.google.com/ p/musicg /

1
Mrug

Si vous cherchez une solution dans .NET, vérifiez la bibliothèque SoundFingerprinting .

Il est open source et construit sur le papier de recherche d'empreintes digitales de contenu à l'aide d'ondelettes.

L'algorithme est différent de celui de Shazaam, mais l'idée générale est similaire: extraire les coefficients les plus importants du spectre, puis les utiliser pour construire les empreintes digitales pour une récupération ultérieure.

La description de l'algorithme peut être trouvée ici .

1
AddictedCS