¡Hablar con una máquina ya es una realidad!

Establecer y construir las condiciones de un diálogo entre el ser humano y la máquina es uno de los nuevos retos de la tecnología de reconocimiento de voz y para crear un entendimiento oral entre el hombre y la máquina nace la ergolingüística.

Publicado el 27 Mar 2003

Todos en alguna ocasión, cuando hemos querido acceder a un servicio de información telefónica, nos hemos encontrado con este mensaje Si usted desea hablar con el departamento marketing, marque 1 o si desea hablar con el departamento de soporte técnico, marque 2. Este modo de interacción entre las personas y los servicios de información basado en la marcación por tonos, en algunas ocasiones resulta bastante engorroso, especialmente cuando la llamada se efectúa desde un teléfono móvil, o es imposible si el teléfono carece de marcación por multifrecuencia (tonos). Esta es la razón por la que está tecnología se está sustituyendo por sistemas que utilizan software de reconocimiento de voz.
La tecnología de reconocimiento de voz (ASR) permite a la máquina comprender, asimilar y tratar las peticiones realizadas por el usuario mediante su voz. No debemos olvidar que el teléfono es la herramienta más utilizada para solicitar información, y es que la voz es el medio más sencillo para sustituir al teclado y al ratón.
Entre las diferentes empresas que están posibilitando este fenómeno, se encuentra Telisma. Fundada en agosto de 2000, Telisma desarrolla y comercializa software de reconocimiento de voz que permite a los operadores de telecomunicaciones y a los proveedores de aplicaciones telefónicas crear e implantar fácilmente servicios vocales a gran escala para las empresas y el gran público. Sus productos se basan en una tecnología innovadora de reconocimiento de voz, que es el resultado de más de 15 años de investigaciones en el seno de France Telecom. I+D.

Establecer y construir las condiciones de un diálogo entre el ser humano y la máquina es uno de los nuevos retos de la tecnología de reconocimiento de voz. Crear un entendimiento oral entre el hombre y la máquina es la actividad desarrollada por el profesional de la ergolingüística, una nueva profesión que se podría definir como un intérprete entre el ser humano y la máquina. Estos hombres y mujeres se pueden contar hoy en día con los dedos de la mano, pero han sabido crear y proporcionar al mercado, junto con expertos informáticos en la tecnología de reconocimiento de voz, sistemas capaces de reconocer todas las palabras claves y de ofrecer una respuesta a una solicitud del usuario.
Antes de proponer a una compañía los mensajes de reconocimiento vocal, el ergo-lingüista debe imaginar todas las preguntas posibles en términos del lenguaje, de las frases, de las palabras, de los acentos así como del comportamiento esperado.
Como comenta Latifa Taleb, ergolingüista en Telisma, al principio, no conocemos el contexto de la llamada, es decir, si la llamada proviene, por ejemplo, de una persona asustada por un incendio, por lo que debemos imaginar todas las situaciones, saber gestionar los silencios de los interlocutores, un error, reconocer los acentos entre las diferentes provincias, pensar en una pregunta amable a una respuesta poco pertinente sin molestar al que llama. En definitiva, el objetivo es proporcionar la información que se busca sin intervención de un teleoperador, evitando que la persona que llama termine colgando, desesperado con el sistema, y sin la información que buscaba.
La concepción y la puesta en marcha de un sistema de reconocimiento de voz podría resumirse en las tres etapas siguientes La primera fase consiste en el estudio del factor humano; cuando existe un departamento de servicio al cliente con diálogos de persona a persona se trabaja primeramente sobre estos datos. La segunda etapa es la de reflexionar sobre la manera de llevar a cabo el diálogo el usuario debe poder navegar por el sistema en búsqueda de la información que necesita de forma rápida y sencilla. Y la última etapa, consiste en tener en cuenta la gestión de los errores.
Pero conviene insistir en que toda esta labor está desarrollada para evitar que el interlocutor cuelgue antes de obtener la información deseada. Para ello, el usuario debe entender rápidamente los distintos pasos que tiene que seguir. El mensaje de bienvenida es el más importante, añade Latifa Taleb. En muy poco tiempo, se le debe explicar al usuario lo que se espera de él y cómo puede encontrar la información que ofrece el servicio, en función de un diseño de diálogo sencillo y lógico que guíe a la persona entre los diferentes servicios ofrecidos. Además, hay que destacar que cada empresa no tiene las mismas exigencias en términos de imagen. Es cierto que el mensaje de una agencia de viajes será distinto que el mensaje de un banco.
Hoy por hoy, esta sofisticada tecnología, resultado de muchos años de investigación y desarrollo, ha conseguido una cierta madurez y las aplicaciones y los escenarios donde desplegarlas son múltiples. Ya se puede proporcionar una multitud de servicios para las compañías que quieren proporcionar un acceso vocal a su información corporativa como complemento a sus canales actuales (oficinas de información, Internet,…).
Asimismo, los aspectos económicos, siempre importantes máxime en época de crisis, también justifican la puesta en marcha de estos servicios, ya que la gestión y el mantenimiento de los mismos resulta más rentable que los proporcionados de forma tradicional.

Uno de los signos más significativos de la madurez que está alcanzando este tipo de soluciones es la estandarización. Así normas de facto como VoiceXML y AURORA comienzan a ser adoptadas por un mayor número de proveedores de plataformas vocales que integran software de reconocimiento de voz.
El lenguaje VoiceXML facilita el desarrollo de aplicaciones basadas en el reconocimiento, ya que permite construir servicios hablados de forma sencilla, proporcionando al usuario otra alternativa para la interacción hombre-máquina. Telisma, como promotor del Foro VoiceXML, proporciona el único intérprete VoiceXML en código fuente realmente diseñado para las necesidades de los operadores, permitiendo crear aplicaciones vocales rápida y fácilmente, adaptándose a este nuevo estándar del mercado.
Una muestra más del auge que están teniendo estas tecnologías en la actualidad, es la reciente creación de la Asociación Española de Proveedores de Tecnologías para la Interacción Cliente-Empresa, Intéritis, en la que se han unido los principales proveedores de estas aplicaciones tecnológicas, entre los que se encuentra Telisma, con el objetivo de promover la formación, el conocimiento, la utilización y el desarrollo de servicios y productos basados en las mismas.
Juan Ramón Campos, director General de Telisma para España, Portugal y América Latina

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados

Artículo 1 de 5