Tendencias

Expansión de las tecnologías e interfaces por voz

Gracias a los avances tecnológicos, las interfaces por voz se están ganado un espacio importante en las plataformas digitales. Revisamos su evolución y los beneficios y desafíos que esto significa para los proyectos.

interfaces por voz

Las interfaces por voz hacen posible que hablemos con los computadores para activar procesos o servicios. Gracias a esto, podemos realizar varias actividades a la vez, ya que deja libres nuestras manos y vista.

Estas tecnologías de reconocimiento de voz tuvieron una mala recepción en años anteriores, lo que contrasta con el éxito que están teniendo en la actualidad. Esto ocurrió porque las personas tienen poca paciencia con las máquinas que no entienden o dan respuestas sin sentido.

El diseño de una buena interfaz por voz debe combinar conocimientos de la psicología, computación y lingüística. Además, se deben considerar las características de la audiencia, ya que cada grupo tiene distintas formas de hablar, necesidades y capacidades tecnológicas.

Las nuevas aplicaciones de esta tecnología se han preocupado de estos aspectos. De esta forma, su éxito actual se explica por las mejoras en el rendimiento, usos y funciones ampliadas y un diseño más apropiado a las necesidades de los usuarios.

Según una encuesta realizada por Stone Temple, los usuarios usan los comandos por voz principalmente porque hoy su funcionamiento es más rápido y significa menos trabajo.
Gráfico sobre las razones por las que los usuarios usan comandos de voz

Tipos de interacción por voz

Para entender los alcances de esta tecnología, es importante conocer las formas en que puede funcionar. Estos son los cuatro roles de interacción principales:

Comandos

La interacción por comandos es la forma más básica y tradicional. Consiste en usar órdenes simples que siguen una estructura fija (verbo + sustantivo), como por ejemplo “Llamar mamá” o “Pausar música”.

Este tipo de interacción es la más apropiada para las acciones que requieren gran precisión, ya que limita el espacio para interpretaciones incorrectas.

Dictados

Los dictados requieren de un periodo de entrenamiento para ser efectivos. Esto porque el sistema aprende las particularidades de la forma de hablar de un usuario.

Aún cuando los mejores sistemas logran solo un 80% de precisión, es una función muy apreciada en un contexto en que cada vez realizamos más actividades a la vez.

Agentes

Un agente es un sistema que captura el lenguaje natural y lo procesa para dar una respuesta apropiada, en distintos formatos. Algunos ejemplos de este tipo de interacción son Siri, Google Home y Amazon Echo.

Este tipo de interacciones podría empezar a verse en las relaciones entre empresas y usuarios, donde los asistentes virtuales o chatbots están tomando cada vez más relevancia.

Identificación

Las interfaces por voz también son capaces de reconocer quién les está hablando. Esta tecnología aún está en desarrollo, pero podría usarse pronto en muchos sistemas de seguridad.

También se puede usar para distinguir las preferencias e historiales de cada usuarios y resguardar la privacidad de algunos contenidos.

Beneficios y desafíos de las interfaces por voz

El mayor beneficio asociado a estas interfaces es la comodidad. Con los últimos avances, al realizar acciones por voz ya no es necesario estar sentado frente al computador, usar las manos para empezar a usar el sistema o mirar hacia la pantalla.

En la encuesta de Stone Temple, todas las personas estuvieron de acuerdo en que las tecnologías por voz hacen más fácil el uso de los smartphones.
Gráfico de respuestas la pregunta ¿Los comandos por voz hacen más fácil el uso de un smartphone?

Esto beneficios se pueden traducir en ahorro de tiempo y mayor eficiencia en general.

Sin embargo, esta tecnología aún tiene muchas limitaciones. Funciona casi sin problemas en las búsquedas y accesos rápidos, pero las transacciones y procesos más complejos aún necesitan avanzar. El principal desafío es asegurar la precisión, ya que el riesgo de cometer errores en acciones sensibles es muy alto.

En el futuro, se espera que podamos manejar pantallas completas por voz, solucionando los problemas asociados al uso de la tecnología touch. Esto también sería aplicable a computadores de escritorio, los que podrían incluso prescindir de un teclado y un mouse.

Estos cambios también significan un desafío para las estrategias digitales. Los proyectos tendrán que considerar esta tecnología en sus técnicas de diseño, posicionamiento y analítica para responder adecuadamente.

Colaboradora en Marketing de Contenidos
Gestiono contenidos para comunidades específicas, estimulando el flujo de información y la interacción con los integrantes de cada comunidad. Me interesa explorar las oportunidades que genera la interacción online entre las empresas y sus clientes.

Comentarios