Un moteur Speech-To-Text (STT) permet de transcrire un flux sonore en texte.
Comparatif
Jarvis propose un certain nombre de STT pour la reconnaissance du mot clé (ex: JARVIS) et la reconnaissance des commandes (ex: Allume le bar). Voici un tableau comparatif des STT ainsi que leur utilisation recommandée:
SnowBoy | PocketSphinx | Bing Speech API | Google Speech API | Wit | |
---|---|---|---|---|---|
Utilisation | Illimitée | Illimitée | 5000/mois | 50/jour | Inconnu |
Vie privée | Hors Ligne | Hors Ligne | En ligne | En ligne | En ligne |
Langues | Votre voix | Anglais | Multi-langue | Multi-langue | Multi-langue |
Dictionnaire | Personnel | Limité | Complet | Complet | Complet |
Précision | Excellente | Bonne | Excellente | Excellente | Excellente |
Réactivité | Très rapide | Bonne | Bonne | Bonne | Bonne |
Pour Mot-clé | ✔ | ✔ | |||
Pour Commandes | Commmandes rapides | ✔ | ✔ | ✔ | |
Notre Choix | Mot clé | Commandes |
Procédure pour enregistrer votre propre hotword Snowboy
Procédure pour obtenir votre clé Bing Speech API
Sélectionner dans Jarvis
La sélection du moteur de reconnaissance vocale se fait dans:
- Settings > Voice recognition> Recognition of magic word
- Settings > Voice recognition > Recognition of magic commands
Voir aussi: Synthèse vocale