Reconocimiento de voz de Google funcionar谩 sin conexi贸n a Internet

Nuevo sistema s贸lo requiere 20 MB de memoria en el smartphone.

La mayor铆a de los servicios de Google que utilizan inteligencia artificial y aprendizaje autom谩tico dependen de conexi贸n a Internet debido a que el procesamiento es realizado en los servidores de la empresa. Esto se debe, espec铆ficamente, a聽que la utilizaci贸n de capacidad聽 de c贸mputo es demasiado聽intensa como para poder ser ejecutada, por ejemplo, en un smartphone.

Con todo, esta situaci贸n supone varios inconvenientes. Uno de ellos es la necesidad de contar con acceso a Internet para poder utilizar los servicios. Otro factor,聽 inc贸modo para muchos usuarios, esta necesidad de compartir con Google toda la informaci贸n.

Parte de estos inconvenientes parecen ser resueltos en un documento publicado por Google, titulado “Reconocimiento personalizado de voz en dispositivos m贸viles“,聽 Donde聽se describe un sistema聽 que no requiere conexi贸n a Internet para funcionar.聽 En el documento聽 se indica que un tel茅fono Nexus 5聽 ejecuta el software con una velocidad聽 7 veces mayor que el tiempo real, con un ratio de errores de 13,5%.聽 El sistema es descrito como compacto y con聽 soporte para un amplio vocabulario. La utilizaci贸n de memoria se reduce a los 20,3 MB, que equivale aproximadamente el 1% de la memoria disponible en un聽Nexus 5.

Google escribe: “Numerosos comandos de voz pueden ser completados y ejecutados en un dispositivo sin contar con conexi贸n a Internet,聽 o f谩cilmente colocados聽 en espera, para ser ejecutados posteriormente como tarea secundaria en una red poco confiable o lenta. Por ejemplo, un comando como ‘Enviar un correo electr贸nico a Darnica Cumberland聽 se帽alando:聽 驴podemos re agendar?‘聽 Puede ser transcrito por un sistema de reconocimiento de voz incrustado, y ejecutado posteriormente sin que implique una diferencia de percepci贸n en el usuario”.

La empresa indica que un reto en tal sentido puede ser la transcripci贸n del nombre de la persona se帽alada. Esta situaci贸n se solucionar铆a integrando informaci贸n personal disponible en el dispositivo, como por ejemplo la lista de contactos, en el modelo ling眉铆stico aplicado.聽El margen de error ser铆a, como se indic贸 anteriormente, de 13,5%.

El sistema ser谩 presentado en la聽 conferencia internacional聽IEEE,聽聽 sobre ac煤stica y procesamiento de lenguaje y de se帽ales, a realizarse en Shanghai, China, la pr贸xima semana. Por ahora se desconoce cuando la tecnolog铆a eventualmente estar谩 a disposici贸n de servicios como Google Now.


Destacamos

Contacto | Diario TI es una publicaci贸n de MPA Publishing International Ltd.