Reconnaissance vocale : la meilleure API ? - Divers - Programmation
MarshPosté le 22-04-2009 à 15:01:05
Bonjour,
J'étudie aujourd'hui la reconnaissance vocale, et dans le but d'établir un logiciel performant et propre à mes besoins, je cherche une API efficace.
Le cahier des charges est le suivant : - l'API doit supporter la reconnaissance vocale du français (si possible avec quelques mots en anglais sans que ça lui pose problème, après je peux toujours essayer d'adapter dans l'application) - elle devra traiter correctement le bruit de fond et les accents de prononciation - les machines destinées à recevoir l'application tourneront sous XP et Vista - elle doit minimiser le temps d'apprentissage de l'user (temps pour lequel elle s'approprie les caractéristiques de sa voix : ton, vitesse, volume, accent ... )
Quelques Speech API sont disponibles, comme :
SAPI 5.3 (Speech API) de Windows, manipulable via des objets COM ou directement en passant par la bibliothèque System.Speech du framework .NET 3.0 . Seule la version 5.3 m'intéresse car c'est la seule à prendre en charge le français. Je sais que cette version est native sous Vista, et incluse dans le Windows SDK (utilisable sous XP).
SMAPI (Speech Managed API) fournie par IBM ViaVoice. Elle traite uniquement la reconnaissance vocale (pas la synthèse, contrairement à la précédente), et prend en charge le français. Elle est composée de deux APIs en réalité : la première comportant le moteur de reconnaissance vocale, la deuxième qui compile les grammaires.
JSAPI (Java Speech API) fournie également par IBM. Elle est utilisable seulement pour des applications en Java. Pour l'instant, il me reste quelques recherches à faire pour une documentation plus complète...
Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques sur ces API, la seule chose qui me manque, ce sont des points de vue, des avis.
Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en pensez-vous ? Lesquelles se valent ? Ont-elles de bons taux de reconnaissance ? Une marge d'erreur signifiante ? Un défaut particulier ?
Il est inutile de me coller des liens sur les logiciels existants sur le marché, exploitant ou non les API citées : ce n'est pas ce que je cherche. En revanche, s'il existe d'autres API non citées, ça m'intéresse.
Marsh Posté le 22-04-2009 à 15:01:05
Bonjour,
J'étudie aujourd'hui la reconnaissance vocale, et dans le but d'établir un logiciel performant et propre à mes besoins, je cherche une API efficace.
Le cahier des charges est le suivant :
- l'API doit supporter la reconnaissance vocale du français (si possible avec quelques mots en anglais sans que ça lui pose problème, après je peux toujours essayer d'adapter dans l'application)
- elle devra traiter correctement le bruit de fond et les accents de prononciation
- les machines destinées à recevoir l'application tourneront sous XP et Vista
- elle doit minimiser le temps d'apprentissage de l'user (temps pour lequel elle s'approprie les caractéristiques de sa voix : ton, vitesse, volume, accent ... )
Quelques Speech API sont disponibles, comme :
Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques sur ces API, la seule chose qui me manque, ce sont des points de vue, des avis.
Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur signifiante ? Un défaut particulier ?
Il est inutile de me coller des liens sur les logiciels existants sur le marché, exploitant ou non les API citées : ce n'est pas ce que je cherche. En revanche, s'il existe d'autres API non citées, ça m'intéresse.