Android Reconnaissance vocale en tant que service sur Android 4.1 & 4.2

Question

J'ai réussi à faire fonctionner la reconnaissance vocale continue (à l'aide de la classe SpeechRecognizer) en tant que service sur tous les Android versions jusqu'à la version 4.1. Ma question est de la faire fonctionner avec les versions 4.1 et 4.2 telles qu'elles sont connues. il y a un problème dans le fait que l'API ne fonctionne pas de la manière documentée, car quelques secondes après le début de la reconnaissance vocale, si aucune entrée vocale n'a été détectée, c'est comme si le dispositif de reconnaissance vocale mourait en silence. ( http://code.google.com/p/Android/issues/detail?id=3788 )

J'ai trouvé une question qui propose un moyen de contourner ce problème ( La reconnaissance vocale cesse d'écouter après quelques secondes ), mais je ne sais pas comment implémenter le gestionnaire requis pour cette solution. Je suis conscient du "bip" qui se produira toutes les quelques secondes que cette solution de contournement causera, mais la reconnaissance vocale continue est plus importante pour moi.

Si quelqu'un a d'autres solutions de contournement, j'aimerais les entendre également.

Hoan Nguyen · Accepted Answer

Ceci est une solution pour Android version 4.1.1.

public class MyService extends Service { protected AudioManager mAudioManager; protected SpeechRecognizer mSpeechRecognizer; protected Intent mSpeechRecognizerIntent; protected final Messenger mServerMessenger = new Messenger(new IncomingHandler(this)); protected boolean mIsListening; protected volatile boolean mIsCountDownOn; private boolean mIsStreamSolo; static final int MSG_RECOGNIZER_START_LISTENING = 1; static final int MSG_RECOGNIZER_CANCEL = 2; @Override public void onCreate() { super.onCreate(); mAudioManager = (AudioManager) getSystemService(Context.AUDIO_SERVICE); mSpeechRecognizer = SpeechRecognizer.createSpeechRecognizer(this); mSpeechRecognizer.setRecognitionListener(new SpeechRecognitionListener()); mSpeechRecognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, this.getPackageName()); } protected static class IncomingHandler extends Handler { private WeakReference<MyService> mtarget; IncomingHandler(MyService target) { mtarget = new WeakReference<MyService>(target); } @Override public void handleMessage(Message msg) { final MyService target = mtarget.get(); switch (msg.what) { case MSG_RECOGNIZER_START_LISTENING: if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.JELLY_BEAN) { // turn off beep sound if (!mIsStreamSolo) { mAudioManager.setStreamSolo(AudioManager.STREAM_VOICE_CALL, true); mIsStreamSolo = true; } } if (!target.mIsListening) { target.mSpeechRecognizer.startListening(target.mSpeechRecognizerIntent); target.mIsListening = true; //Log.d(TAG, "message start listening"); //$NON-NLS-1$ } break; case MSG_RECOGNIZER_CANCEL: if (mIsStreamSolo) { mAudioManager.setStreamSolo(AudioManager.STREAM_VOICE_CALL, false); mIsStreamSolo = false; } target.mSpeechRecognizer.cancel(); target.mIsListening = false; //Log.d(TAG, "message canceled recognizer"); //$NON-NLS-1$ break; } } } // Count down timer for Jelly bean work around protected CountDownTimer mNoSpeechCountDown = new CountDownTimer(5000, 5000) { @Override public void onTick(long millisUntilFinished) { // TODO Auto-generated method stub } @Override public void onFinish() { mIsCountDownOn = false; Message message = Message.obtain(null, MSG_RECOGNIZER_CANCEL); try { mServerMessenger.send(message); message = Message.obtain(null, MSG_RECOGNIZER_START_LISTENING); mServerMessenger.send(message); } catch (RemoteException e) { } } }; @Override public void onDestroy() { super.onDestroy(); if (mIsCountDownOn) { mNoSpeechCountDown.cancel(); } if (mSpeechRecognizer != null) { mSpeechRecognizer.destroy(); } } protected class SpeechRecognitionListener implements RecognitionListener { @Override public void onBeginningOfSpeech() { // speech input will be processed, so there is no need for count down anymore if (mIsCountDownOn) { mIsCountDownOn = false; mNoSpeechCountDown.cancel(); } //Log.d(TAG, "onBeginingOfSpeech"); //$NON-NLS-1$ } @Override public void onBufferReceived(byte[] buffer) { } @Override public void onEndOfSpeech() { //Log.d(TAG, "onEndOfSpeech"); //$NON-NLS-1$ } @Override public void onError(int error) { if (mIsCountDownOn) { mIsCountDownOn = false; mNoSpeechCountDown.cancel(); } mIsListening = false; Message message = Message.obtain(null, MSG_RECOGNIZER_START_LISTENING); try { mServerMessenger.send(message); } catch (RemoteException e) { } //Log.d(TAG, "error = " + error); //$NON-NLS-1$ } @Override public void onEvent(int eventType, Bundle params) { } @Override public void onPartialResults(Bundle partialResults) { } @Override public void onReadyForSpeech(Bundle params) { if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.JELLY_BEAN) { mIsCountDownOn = true; mNoSpeechCountDown.start(); } Log.d(TAG, "onReadyForSpeech"); //$NON-NLS-1$ } @Override public void onResults(Bundle results) { //Log.d(TAG, "onResults"); //$NON-NLS-1$ } @Override public void onRmsChanged(float rmsdB) { } } }

16/02/2013 - Corrigez le bip sonore si vous utilisez Text To Speech dans votre application, assurez-vous de désactiver le flux solo dans onResults

Nikolay Shmyrev · Answer

Si vous souhaitez réellement implémenter l'écoute continue sans connexion Internet, vous devez envisager des packages tiers, par exemple CMUSphinx, cochez Pocketsphinx Android démo , par exemple, écoutez efficacement le mot clé hors ligne et réagissez sur les commandes spécifiques, comme une phrase clé "Un ordinateur puissant". Le code pour le faire est simple:

vous créez un identifiant et ajoutez simplement une recherche par mot clé:

recognizer = defaultSetup() .setAcousticModel(new File(modelsDir, "hmm/en-us-semi")) .setDictionary(new File(modelsDir, "lm/cmu07a.dic")) .setKeywordThreshold(1e-5f) .getRecognizer(); recognizer.addListener(this); recognizer.addKeywordSearch(KWS_SEARCH_NAME, KEYPHRASE); switchSearch(KWS_SEARCH_NAME);

et définir un auditeur:

@Override public void onPartialResult(Hypothesis hypothesis) { String text = hypothesis.getHypstr(); if (text.equals(KEYPHRASE)) // do something }

Eran Katsav · Answer

Pour tous ceux qui essaient de faire taire le bip, recadrer la réponse @HoanNguyen qui est très bonne mais soyez prudent, comme indiqué dans l’application api, setStreamSolo est cumulatif, donc s’il ya erreur dans la reconnaissance vocale par exemple, pas de connexion Internet), alors setStremSolo true est appelé à plusieurs reprises, ce qui entraînera la mise en silence de votre application pour tout le téléphone (très mauvais)! la solution consiste à ajouter le paramètre setStremMute (false) à la méthode speechRecognizer onError.

Gal Rom · Answer

découvrez mon application de démonstration: https://github.com/galrom/ContinuesVoiceRecognition

Je recommande d'utiliser à la fois PockeySphix et SpeechRecognizer.