La precisión de reconocimiento de voz de Dragon NaturallySpeaking se acerca al 100%

Después de dictar en Dragon NaturallySpeaking, el teclado del PC parece un artefacto primitivo.

Para la presente evaluación empleamos Dragon NaturallySpeaking 12 Premium para Windows (€ 149). Nuance también ofrece las versiones Home (€ 99), Premium Wireless (€ 249) y Premium Mobile (€ 249). Cabe señalar que la versión Home 12 es igualmente potente en cuanto a capacidad de reconocimiento de voz, pero carece de funcionalidad como integración con hojas de cálculo o dictado mediante soportes de grabación externos, como por ejemplo grabadoras digitales.

A las 100 nuevas características que incorpora NaturallySpeaking se suma una mayor velocidad y facilidad de uso, mediante menús de ayuda adicionales, nuevos comandos de voz y la posibilidad de personalizar opciones y tareas.

Dragon NaturallySpeaking también ha mejorado considerablemente la exactitud de las opciones presentadas al usuario en la ventana de corrección. Según pudimos comprobar, las opciones de corrección presentadas durante las pruebas incluían invariablemente la palabra correcta entre las alternativas a elegir. Esto es válido para las palabras de vocabulario general; sólo para el caso de nombres, denominaciones o marcas infrecuentes fue necesario recurrir a la función de deletrear.

Durante la instalación, el programa pregunta al usuario su edad, sexo y acento. Luego realiza una prueba de audio, detectando la sensibilidad del micrófono y su desempeño con el hardware disponible. Finalmente escucha la voz del usuario durante una breve sesión de entrenamiento de 5-6 minutos. El programa también ofrece al usuario la opción de examinar documentos almacenados en el disco duro y/o correo electrónico enviado con el fin de detectar no solo las palabras más frecuentemente utilizadas por este, sino también su estilo personal de redacción.

Dragon se adapta al estilo de redacción del usuario.

Al ser activado, Dragón coloca una discreta barra de control en la parte superior de la pantalla, que también puede ser activada como barra lateral. Para activar el micrófono, el usuario puede hacer clic en un pequeño icono, presionar una tecla o sencillamente dar a Dragon el jovial comando “A trabajar”; y para desactivarlo, el igualmente desenfadado “A dormir”. El programa incluye un tutorial interactivo.

El tutorial interactivo permite familiarizarse con las funciones básicas del software.

Si una palabra determinada no es reconocida por el programa, el usuario puede agregarla o corregirla mediante comandos de voz. Dragon presenta una lista de correcciones posibles. En caso de no haber alguna en la lista, el usuario puede deletrearla o escribirla manualmente. De esa forma, el programa reconocerá la palabra si ésta aparece en dictados posteriores. En nuestras pruebas constatamos que Dragon NaturallySpeaking  sólo necesita una corrección para incorporar definitivamente la palabra en su base de datos.

El programa ofrece además la posibilidad de cambiar una palabra o frase ya dictada simplemente seleccionándola con un comando de voz. En tal caso, Dragon NaturallySpeaking supone que el usuario ha decidido cambiar la palabra o frase como parte de un proceso de redacción y revisión, y no debido a que sea una palabra no transcrita correctamente. Esto es importante, ya que el programa en tal caso no alterará el reconocimiento de la palabra o frase a futuro. El usuario puede seleccionar frases completas e incluso párrafos con el fin de borrarlos, moverlos o formatearlos.

La nueva versión de NaturallySpeaking incorpora Dragon Remote Microphone App, una aplicación que permite a los usuarios dictar en un smartphone o tableta operada con Android o iOS. Dragon NaturallySpeaking  no sólo reconoce lo que el usuario dicta, sino ha mejorado la posibilidad de navegar entre aplicaciones y ventanas utilizando sólo la voz. Estas funciones han sido mejoradas para los servicios de correo electrónico online como Hotmail y Gmail, y también para redes sociales Facebook y Twitter. Esto implica que el software permite operar fácilmente con la voz estos servicios accedidos por navegador.

La nueva versión de Dragon NaturallySpeaking  incorpora soporte mejorado para auriculares y micrófonos Bluetooth. El producto ahora soporta Bluetooth a 16 kHz, que es la banda de frecuencia para Bluetooth con la mayor fidelidad y, por lo tanto, mejor reconocimiento de la voz mediante tales dispositivos.

Dragon NaturallySpeaking permite dictar a alta velocidad, con un margen de error prácticamente inexistente. En la medida que se producen errores, éstos se deben principalmente a que el propio usuario está desconcentrado o comete errores de dicción.

La versión Premium que hemos probado graba automáticamente el dictado en la medida que éste avanza, y la función de reproducir permite escuchar lo que se ha dictado. El programa también transcribe grabaciones de audio en los formatos WAV, WMA, DSS, DS2 y MP3. Cuando probamos esta función, transcribiendo desde una grabadora digital, notamos que el tiempo de transcripción es algo mayor al de dictado en tiempo real. Sin embargo, la calidad de la transcripción es cercana al 100%.

Este artículo ha sido escrito íntegramente con Dragon NaturallySpeaking y sólo nos queda concluir que el teclado del PC parece ser un periférico primitivo después de haber usado este programa de reconocimiento de voz.

Redacción Diario TI


Únase a la conversación

Contacto | Diario TI es una publicación de MPA Publishing International Ltd., Reino Unido. © Copyright 1997-2022