El Viernes, 16 de Junio de 2006 9:48 AM, consultores1 escribió: > El Viernes, 16 de Junio de 2006 3:22 AM, Aritz Beraza Garayalde [Rei] > > escribió: > > El Viernes, 16 de Junio de 2006 01:06, consultores1 escribió: > > > Hola > > > > > > Estoy iniciando un pequeno proyecto y me gustaria hacerlo en Debian. > > > El asunto es: 1 microfono direccionable inalambrico de alta fidelidad > > > que reciba la voz, en una reunion por ejemplo ; la mande a una laptop > > > viejita y la muestre en pantalla como texto; se requiere que funcione > > > en varios idiomas. > > > > Olvidate de usar un portatil viejito. Sobretodo si quieres que soporte > > varios idiomas a la vez. (De hecho no se si existe algun programa que sea > > capaz de discernir que idioma usa el interlocutor para cambiar el > > diccionario). > > > > > Es un proyecto para sordos y se realizara como ayuda comunitaria. > > > Actualmente, una persona esta a la par del sordo y escribe lo que > > > escucha, lo que inmediatamente sirve para saber de que se trata. La > > > otra forma es que se usa un microfono directo al aparato en la oreja > > > del susodicho, pero esta forma tiene el inconveniente de que hay que > > > pasarse el microfono y cuando la cosa se calienta, se olvidan de > > > pasarlo! > > > > > > Por supuesto que ya aparecieron los lagartos proponiendo > > > ViaVoz+Ws+maquinas de $2,500.00: pero me gustaria intentar con Debian y > > > por eso les pregunto. > > > > Creo que comercialmente disponibles el dragon naturally speaking y el > > viavoice son los dos sistemas de reconocimiento de habla mas avanzados. > > Ninguno de ellos dispnibles en debian. Ambos tienen algo que necesitaras: > > Diccionarios especificos. > > > > En linux tienes sphinx, un buen "motor". No es en si un sistema de > > reconocimiento de habla completo, pero con sphinx3 (por que sphinx4 > > necesita java y eso significa mas consumo de recursos) y un vocabulario > > podrias tener el sistema funcionando (el ejecutable para convertir en > > texto lo que llegue por el microfono ya viene de serie). > > > > Tu problema sera el vocabulario (los modelos lexicos y acusticos del > > castellano me imagino que estaran disponibles en alguna parte). Pero un > > vocabulario minimamente extenso (5000-20000 palabras) con palabras > > especificas como las que se usan en las conversaciones en las que piensas > > usarlo, va a ser mas complicado, y seguramente tendreis que crearlo. > > > > Lo del microfono es otro problema. Quieras o no, va a entrar mucho ruido, > > sobretodo si se entra en una discusion acalorada, y eso es matador en los > > sistemas de reconocimiento de habla. El microfono (y la tarjeta de audio) > > son _muy_ importantes. Un sistema ideal usaria un microfono por persona. > > Estilo el parlamento, cuando alguien va a hablar, pulsa su microfono. El > > sistema usa la entrada del resto de microfonos para cancelar el ruido y > > las conversaciones paralelas que puedan producirse. Pero supondre que > > esto es inviable. > > > > > Como no tenemos nada claro, cualquier idea o sugerencia nos vendria muy > > > bien. > > > > Pasate por la web del proyecto sphinx > > http://cmusphinx.sourceforge.net/html/cmusphinx.php > > > > mirate la informacion del tutorial y el resources to buils a system. > > Mirate tambienel manual. Con esto tienes todo lo necesario para montarte > > tu sistema. pero si estas vago... > > > > Tienes perlbox voice http://www.perlbox.org/ que usa sphinx2 para el > > reconocimiento del habla. (aparte de tener otras utilidades) no lo he > > probado. > > > > Ya te aviso que de todas formas vas a tener que entrenarlo mucho. (y > > entrenarlo es bastante costoso), por que la mayoria de modelos y > > diccionarios que he encontrado son para el ingles. > > > > Saludos > > Aritz Beraza [Rei] > > Infinitas gracias Aritz, por responder, segun lo que dices, se puede > realizar, luego te cuento. > > hasta pronto.
Hola Aritz y a todos. He investigado un poco y solamente he encontrado trabajos muy buenos basados en la informacion que me distes, orientados a convertir texto a voz. (KMouth, KSayit, Kttsmgr y otros) Agrego, que los programas citados estan en Etch. Me llama la atencion que no encuentro nada terminado para convertir voz a texto! Sabe alguien, cual podria ser la dificultad? Yo no se mucho de esto, pero segun veo, seria de grabar la voz y convertirla en texto. Gracias anticipadas, se agradece cualquier informacion.