DiarioTi.com - el diario del profesional TI

Miércoles 22 Oct 2014 | Año 14 | Edición 4150
search social
Menu
letter


La precisión de reconocimiento de voz de Dragon NaturallySpeaking se acerca al 100%

Hemos probado el software de reconocimiento de voz y dictado Dragon NaturallySpeaking, que incorpora 100 novedades aparte de mejorar en 15% su precisión.

Diario TI 04/02/13 7:00:43

Para la presente evaluación empleamos Dragon NaturallySpeaking 12 Premium para Windows (€ 149). Nuance también ofrece las versiones Home (€ 99), Premium Wireless (€ 249) y Premium Mobile (€ 249). Cabe señalar que la versión Home 12 es igualmente potente en cuanto a capacidad de reconocimiento de voz, pero carece de funcionalidad como integración con hojas de cálculo o dictado mediante soportes de grabación externos, como por ejemplo grabadoras digitales.

A las 100 nuevas características que incorpora NaturallySpeaking se suma una mayor velocidad y facilidad de uso, mediante menús de ayuda adicionales, nuevos comandos de voz y la posibilidad de personalizar opciones y tareas.

Dragon NaturallySpeaking también ha mejorado considerablemente la exactitud de las opciones presentadas al usuario en la ventana de corrección. Según pudimos comprobar, las opciones de corrección presentadas durante las pruebas incluían invariablemente la palabra correcta entre las alternativas a elegir. Esto es válido para las palabras de vocabulario general; sólo para el caso de nombres, denominaciones o marcas infrecuentes fue necesario recurrir a la función de deletrear.

Durante la instalación, el programa pregunta al usuario su edad, sexo y acento. Luego realiza una prueba de audio, detectando la sensibilidad del micrófono y su desempeño con el hardware disponible. Finalmente escucha la voz del usuario durante una breve sesión de entrenamiento de 5-6 minutos. El programa también ofrece al usuario la opción de examinar documentos almacenados en el disco duro y/o correo electrónico enviado con el fin de detectar no solo las palabras más frecuentemente utilizadas por este, sino también su estilo personal de redacción.

Dragon se adapta al estilo de redacción del usuario.

Al ser activado, Dragón coloca una discreta barra de control en la parte superior de la pantalla, que también puede ser activada como barra lateral. Para activar el micrófono, el usuario puede hacer clic en un pequeño icono, presionar una tecla o sencillamente dar a Dragon el jovial comando “A trabajar”; y para desactivarlo, el igualmente desenfadado “A dormir”. El programa incluye un tutorial interactivo.

El tutorial interactivo permite familiarizarse con las funciones básicas del software.

Si una palabra determinada no es reconocida por el programa, el usuario puede agregarla o corregirla mediante comandos de voz. Dragon presenta una lista de correcciones posibles. En caso de no haber alguna en la lista, el usuario puede deletrearla o escribirla manualmente. De esa forma, el programa reconocerá la palabra si ésta aparece en dictados posteriores. En nuestras pruebas constatamos que Dragon NaturallySpeaking  sólo necesita una corrección para incorporar definitivamente la palabra en su base de datos.

El programa ofrece además la posibilidad de cambiar una palabra o frase ya dictada simplemente seleccionándola con un comando de voz. En tal caso, Dragon NaturallySpeaking supone que el usuario ha decidido cambiar la palabra o frase como parte de un proceso de redacción y revisión, y no debido a que sea una palabra no transcrita correctamente. Esto es importante, ya que el programa en tal caso no alterará el reconocimiento de la palabra o frase a futuro. El usuario puede seleccionar frases completas e incluso párrafos con el fin de borrarlos, moverlos o formatearlos.

La nueva versión de NaturallySpeaking incorpora Dragon Remote Microphone App, una aplicación que permite a los usuarios dictar en un smartphone o tableta operada con Android o iOS. Dragon NaturallySpeaking  no sólo reconoce lo que el usuario dicta, sino ha mejorado la posibilidad de navegar entre aplicaciones y ventanas utilizando sólo la voz. Estas funciones han sido mejoradas para los servicios de correo electrónico online como Hotmail y Gmail, y también para redes sociales Facebook y Twitter. Esto implica que el software permite operar fácilmente con la voz estos servicios accedidos por navegador.

La nueva versión de Dragon NaturallySpeaking  incorpora soporte mejorado para auriculares y micrófonos Bluetooth. El producto ahora soporta Bluetooth a 16 kHz, que es la banda de frecuencia para Bluetooth con la mayor fidelidad y, por lo tanto, mejor reconocimiento de la voz mediante tales dispositivos.

Dragon NaturallySpeaking permite dictar a alta velocidad, con un margen de error prácticamente inexistente. En la medida que se producen errores, éstos se deben principalmente a que el propio usuario está desconcentrado o comete errores de dicción.

La versión Premium que hemos probado graba automáticamente el dictado en la medida que éste avanza, y la función de reproducir permite escuchar lo que se ha dictado. El programa también transcribe grabaciones de audio en los formatos WAV, WMA, DSS, DS2 y MP3. Cuando probamos esta función, transcribiendo desde una grabadora digital, notamos que el tiempo de transcripción es algo mayor al de dictado en tiempo real. Sin embargo, la calidad de la transcripción es cercana al 100%.

Este artículo ha sido escrito íntegramente con Dragon NaturallySpeaking y sólo nos queda concluir que el teclado del PC parece ser un periférico primitivo después de haber usado este programa de reconocimiento de voz.

Redacción Diario TI

      • Seleccione su país -+

        Diario TI utiliza una plataforma GeoIP que automáticamente intenta detectar el país desde donde usted se conecta, para así presentarle contenidos regionales. Sin embargo, si la detección automática no es posible, usted puede seleccionar manualmente su país.