Accueil > Forum > > > > Reconnaissance vocale, un peu d'aide ?
Reconnaissance vocale, un peu d'aide ?
lundi 1 mars 2010 à 07:08:39 |
Reconnaissance vocale, un peu d'aide ?

Elindorath
|
Bonjour à tous,
Je suis en train de monter un projet visant à créer un moteur de reconnaissance vocale. Le problème est que la documentation est encore trés pauvre sur le sujet (ou alors je ne sais pas bien chercher ^^). J'ai bien trouver quelques choses : la FFT, la MFCC, ... Mais se sont des parties mathématiques trop complexes pour moi.
C'est pourquoi je m'adresse à vous.
Avez vous un peu de doc sur le sujet ?
Connaissez vous un moyen de reconnaitre des mots dans un fichier sonore sans passer par des formules mathématiques complexes ?
Et si c'est indispensable, pouvez vous m'expliquer un peu fourrier et le reste ?
J'espère que vous pourrez m'aider.
P.S. : Si certains sont intéressé par le projet, faites moi signe. On avancera mieux à plusieurs.
|
|
lundi 1 mars 2010 à 07:12:02 |
Re : Reconnaissance vocale, un peu d'aide ?

Elindorath
|
J'oubliais : pouvez vous m'expliquer à partir de quoi on arrive à reconnaitre des mots ? La forme d'onde, le spectre de fréquence (ça me parait plus approprié pour une faire une empreinte vocale de l'utilisateur), ou autre chose ?
|
|
samedi 6 mars 2010 à 14:22:51 |
Re : Reconnaissance vocale, un peu d'aide ?

Davy974
|
Ça serait quasiment mission impossible pour deux raisons minimum:
- Pour reconnaitre un mot dans un fouillis d'octets, il faudrait analyser le fichier bit a bit et calculer la formule à partir de chaque bit du fichier tout en combinant les résultats obtenus par l'analyse des précédents et comme dans une seconde échantillonnée à 64 kB/s (ce qui est un minimum), il faudrait que tu analyses 524288 bits par secondes. Or, je pense qu'un ordinateur ne peut pas décoder, analyser et calculer je-sais-pas-trop quoi 542888 fois par seconde. Donc quand l'ordinateur aura calculé le pseudo-mot de la première seconde, deux ou trois autres pseudo-mots seront déjà passés. Au final, soit il te faut un supercalculateur, soit il te faut un algo de décodage/analyse hyper-rapide et perfectionné.
- La voix humaine possède à chaque instant T une fréquence fondamentale, un volume et un timbre correspondant à la combinaison des multiples (les harmoniques) de la fréquence fondamentale (voix aérienne et voix solidienne). Comme le timbre varie en fonctionne de l'age, des circonstances, de l'humeur et de X paramètres Y avec Z ramifications inextricables, il te faudrait, comme je te l'ai dit plus haut, un algorithme ultra-perfectionné de décodage, de transposition (vers un timbre normalisé), d'analyse, de calcul, de traitement des résultats, d'association pseudo-mot/code, et enfin d'association code/action à faire.
Le travail serait énorme (dans le cas d'un algorithme perfectionné et infaillible (ce qui à une probabilité infime mais non nulle d'arriver) qui saurait interpréter tout pseudo-mot prononcé dans n'importe quelles circonstances). Toutefois, en se basant sur des algorithmes de calcul en fonction de la variation de fréquence (lorsque tu parles, tu n'émets pas une fréquence fixe, et heureusement) à la Nintendo-DS style, tu pourrait éventuellemnt monter un petit moteur.
Dans tous les cas, je te conseille de te documenter sur le sujet (Google) !
|
|
dimanche 7 mars 2010 à 22:24:09 |
Re : Reconnaissance vocale, un peu d'aide ?

Elindorath
|
Merci Davy pour ta réponse.
Mais il y a plusieurs choses que je ne comprend pas.
Pourquoi cela te parait si infaisable que ça ? Des moteurs de reconnaissance vocale existe déjà tel que dragon naturally speaking ou même celui de microsoft intégré à vista et seven. Et ces moteurs fonctionne très bien sur un ordinateur individuel, sans que se soit des supercalculateurs. C'est cela que j'aimerais arriver à faire. Et comme je l'ai dit, j'ai cherché sur Google, j'ai trouvé pas mal de choses sur les parties purement mathématiques du problème, mais presque rien sur la manière de le coder.
J'ai déjà un peu penser au différentes étapes du processus :
- Obtenir la forme d'onde du son produit
- La simplifier jusqu'à un juste milieu (pas trop compliqué pour une facilité d'analyse, pas trop simple pour ne pas confondre différents mots)
- L'analyser pour reconnaitre les différents phonème en présence
- Reconstituer le mot formé des phonèmes analysés à partir d'un dictionnaire
Dans un premier temps, uniquement avec ma voix comme modèle et comme utilisateur, dans un environnement sans parasite sonore (ma chambre), pour tester le fonctionnement. Je verrais après comment faire pour que ça marche avec d'autres voix ou dans un autre environnement.
Qu'en pensez-vous ? Avez-vous des liens de doc ? Pouvez-vous m'aider à voir comment coder tout ça (je pars en C++ parce que c'est le langage que je connais le plus) ?
|
|
dimanche 23 mai 2010 à 22:43:16 |
Re : Reconnaissance vocale, un peu d'aide ? helppppppppppppppppppppp

mahiealg
|
bonsoir,
je travaille sur le même projet, je suis aussi bloqué, mais mon problème c'est de comprendre ce que fait réellement les fonction LPC et MFCC, je sais qu'ils permettent d'avoir une image de référence qui constituera notre dictionnaire, mais comment se fait le calcul de ces image ??!!
si vous pouvez m'aider je serai très reconnaissant, il me reste pas beaucoup de temps et mon binôme ma planqué !!!
-Elindorath : je voudrais savoir si t'as pu avancé, si t'as pas fini on peut travaillé ensemble sur skype ou msn, ou sinn, si t'as fini envoie moi la doc que t'as utilisé.
merci
mon gros problème : je suis NUL en anglais !!!!! aaaaaaaaaaaaaaaaaaaaaa !!
|
|
Cette discussion est classée dans : aide, projet, vocale, sujet, reconnaissance
Répondre à ce message
Sujets en rapport avec ce message
BESOIN D'AIDE URGENT VC\+\+ [ par capnader ]
Salut,Je suis un étudiant en génie informatique et je prépare un projet de find'étude qui consiste a développer une application qui génère automatique
aide à la réalisation d'un projet sur linux [ par hafed120 ]
le projet consiste à développer un algorthme optimale de recherches de signatures d'attaques dans unréseau:+comment utiliser conjointement un outil de
Projet morphing en commun [ par supergrey ]
Salut a tous, je désire réaliser, avec l'aide de ceux qui désireront m'aider, un logiciel de morphing.Ce que je sais faire: -morphing entre 2 images d
JE BESOIN URGENTMENT D'AIDE!!!!!!! [ par Valde_91 ]
Bonjour! Je suis un étudiant de génie mécanique et pour la fin de cette sémestre (semani prochiane) je doit faire un projet en c++. Le but est de dévl
projet programmation c++... aidez moi svp [ par GoldFk ]
Voilà, je suis étudiant en 1ère ingénieur à bruxelles et j'ai besoin d'aide pour un projet de programmation c++.On pourrait penser que ce n'est pas tr
reconnaissance..vocale ^^ [ par MoDDiB ]
Quelqu'un connaitrait - il un site qui parle de comment traiter une reconnaissance au micro? ou si qq'un a deja attaqué le sujet ca serait sympa qu'il
Projet d etudiant (renseignement et aide) [ par delce ]
Bonjour,je suis etudiant en informatique et mon prof nous a donné comme projet de realiser une application qui nous plait (je sais cela est vague...)c
Novice en C pour concevoir un projet A VRAIMENT BESOIN D AIDE AU PLUS TOT ...... SVP [ par lune ]
je voudrais de l'aide pour concevoir mon projet-partiel en C..Je n'ai jamais fais de 0 et je suis un peu perdu .je voudrais créer le scrabble avec int
aide pour un projet [ par shadowmoon ]
je suis en 1ere année d'iut et j'ai un projet de programmation en c a faire pour la fin de l'année scolaire et j'ai besoin d'une fonction ou un main q
j'ai besoin d'un peu d'aide ;) [ par didkill ]
salut à tous.je suis etudiant au CNAM à paris, en 1er année d'ingenierie.pendant les 3 années passé au CNAM, j'ai etudier le langage ADA, HTML, et un
Livres en rapport
|
Derniers Blogs
POUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDNPOUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDN par neodante
Quelle est le point commun entre : Microsoft il y a 10 ans et Apple aujourd'hui ? Réponse: avoir une politique de protocoles propriétaires et fermés :) Car pour rappel (si si je vous assure c'est important de le rappeler), la majorité des spécifications e...
Cliquez pour lire la suite de l'article par neodante JOYEUX ANNIVERSAIRE NIXJOYEUX ANNIVERSAIRE NIX par ebartsoft
Souhaitons un bon et joyeux anniversaire à notre hôte à tous, Nix.
Je ne le répéterais jamais assez mais sans lui rien ne serait possible. Il défit en permanence les lois de la gravité et comme il le dit si bien, si tu lui fais confiance ça devra...
Cliquez pour lire la suite de l'article par ebartsoft IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) par richardc
Mise à jour des Web API du 14 Mai
Réservez dès maintenant votre journée du 20 juin pour le Windows Azure Dev Camp 2012 à Paris
Mise à jour de Team Foundation Service
MechCommander 2 sur Windows 8
Entity Framework 5 Release Candidate e...
Cliquez pour lire la suite de l'article par richardc
Forum
MATLAB PROGRAMME MATLAB PROGRAMME par wahab1087
Cliquez pour lire la suite par wahab1087 RGB2GRAYRGB2GRAY par musa18
Cliquez pour lire la suite par musa18
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|