La evolución de los BOTs y lo que viene
Por Ricardo Altobelli, Chief Innovation Officer, de BDT Group
Según WikiPedia la definición de bot es la siguiente: ‘Un bot (aféresis de robot) es un programa informático que efectúa automáticamente tareas reiterativas mediante Internet a través de una cadena de comandos o funciones autónomas previas para asignar un rol establecido; y que posee capacidad de interacción, cambiando de estado para responder a un estímulo’.1
Contundente definición y muy apropiada, pero ¿cómo aplicarlos a empresas y personas? Desde hace muchos años las empresas han intentado interactuar con sus clientes de diversas maneras, sin embargo, desde el advenimiento de la Web, la evolución fue exponencial.
Los primeros intentos se basaron en completar un formulario interactivo solicitando los datos de la consulta o transacción y ejecutar ciertos procesos que completan dicha transacción.
Claro está, que la rigidez de los formularios como estructura de captura de datos, tenía como problema principal que debían preverse todas las funcionalidades y ofrecerlas al cliente en forma de menú, que para ambientes de muchas opciones generaba un problema adicional cómo navegar entre todas ellas. Adicionalmente las respuestas no eran online y dependía de una persona para que genere la contestación.
Desafíos de los primeros BOTs
Aprovechando la experiencia de usuario obtenida con el uso de formularios y chats, comenzaron a aparecer los ChatBOTs. La idea era habilitar un componente en la web corporativa que permite chatear con el cliente y que habilite consultas o transacciones por ese medio.
En este punto comienza a vislumbrarse quizás la más difícil tarea a resolver, ¿cómo presentar las opciones que se ofrecen y cómo entender lo que el cliente precisa?
Sin el apoyo de un menú o formulario web que dirija la transacción, la tarea de comprensión de lo que el cliente escribe en el chat fue encarada básicamente de dos maneras: botones de acción e interpretación de patrones.
- Uso de botones: Este mecanismo se basaba en mostrar opciones en forma de botones para orientar al cliente a que accione la opción requerida y lanzando procesos asociados a dichos botones que van solicitando información. Este mecanismo en definitiva era como gestionar un formulario, pero con opciones discretas en cada paso hasta llegar a concretar la operación.
- Uso de patrones: Interpretar lo que el cliente está tratando de hacer utilizando patrones, significa que nuestros procesos deben estar asociados a palabras y que si el cliente en su interacción escribe una de esas palabras entonces se lanza el proceso asociado. Este enfoque preliminar funciona bien para ambientes en que los procesos y las palabras asociadas son concisos y poco ambiguos, sin embargo, la forma en la que se expresan las personas es muy variada y la búsqueda de las palabras clave se hacía cada vez más compleja.
Para estos casos si el cliente de una compañía de seguros escribía: “tuve un accidente, me chocaron”, el BOTs podría tener asociadas las palabras “choque” o “accidente” al proceso de alta de denuncia de siniestro. Sin embargo, si el cliente escribía: “cómo debo proceder ante un accidente”, claramente no quería cargar un siniestro y solo precisaba información, por lo que el enfoque de uso de patrones se volvía complejo cuando se opera en lenguaje natural.
IA como fuerza disruptiva
El público en general se manifiesta de tan variadas formas que el uso de patrones es totalmente ineficaz, ya que las posibilidades son tantas que no es posible encontrar los patrones y asociarlos a transacciones. La gente no habla como robot y no se expresa de la manera que el programador lo estipula, por lo que hubo que encontrar otra manera de interactuar.
Aquí apareció de manera disruptiva la famosa inteligencia artificial o IA, que produjo un cambio tan grande que alentó a nuevas generaciones de BOTs, capaces de comprender el contenido de una frase escrita por un cliente, aislar la intención de la misma y dirigir el proceso en función de esta capacidad de discernir.
Claro está que subirse al gran mundo de la IA no fue fácil para las empresas y tampoco para sus programadores, porque cambiaba radicalmente la forma en desarrollar las soluciones. Aquí aparecieron los grandes jugadores como Google, Amazon, IBM y otros que comenzaron a ofrecer servicios de IA mediante API’s donde los BOTs podrían interactuar y procesar las consultas. De esta manera, el uso de IA se popularizó y a su vez, al tener muchas interacciones de muy variados contenidos alimentando las redes neuronales, los resultados cada vez fueron más precisos.
Con esta nueva tecnología a disposición y con la sencillez de uso y bajo costo por transacción, los BOTs comenzaron a poder procesar audios, convirtiéndolos en texto para interpretarlos y viceversa. Desde allí los clientes podrían optar entre escribir o hablarle al chat, lo que dio origen a los VoiceBOTs.
VoiceBOTs: La evolución de los BOTs
Esta evolución en los BOTs también fue disruptiva. Hasta aquel momento, solo existía la posibilidad de interactuar con la voz humana mediante el uso de “comandos de voz” es decir, el usuario podía decir una palabra clave que se interpretaba y se ejecutaba una acción.
Con las mejoras tecnológicas, y con servicios en línea, fue posible armar BOTs que interactúan con el cliente mediante la voz y con lenguaje natural. La voz se convierte en texto (voice recognition), se procesa el texto para obtener la intención, se ejecuta la acción asociada y se elabora una respuesta apropiada en modo texto. Este es convertido a voz sintetizada (text to speech) para que finalmente sea escuchada por el interlocutor.
Este mecanismo aprovecha todo el know how obtenido con el tiempo, y le agrega en los extremos de la conversación la conversión de texto a voz y viceversa, obteniendo un diálogo con cierta fluidez.
Desembarco en las redes sociales
Las redes también fueron un medio en que las empresas se volcaron para ofrecer sus servicios e interactuar con los usuarios. Pero por la naturaleza de las redes sociales, exigía a los comunity managers estar atentos a resolver las consultas de sus clientes, manteniendo un tiempo de respuesta razonable y evitando malestar de los usuarios por la espera. Obviamente, el advenimiento de los BOTs era la solución. Los usuarios de las redes tendrían la posibilidad de chatear con el BOT y resolver sus necesidades.
Por supuesto, las grandes redes notaron esta necesidad y comenzaron a ofrecer API’s para “enganchar” los BOTs a las redes, con una audiencia distinta y con otros tiempos de acción.
Omnicanalidad: Proliferación de canales
Cada vez que las empresas requieren abrir sus contenidos y servicios en un nuevo medio, aparece la dificultad técnica de la conexión, pero también cómo adaptar los contenidos, diálogos, acciones, etc, al nuevo canal.
No es lo mismo chatear desde la web corporativa que hacerlo desde una red social. Los componentes tecnológicos que se requieren son diferentes y también los mecanismos de interacción. Complejizando aún más, si se quiere interactuar mediante la voz.
El concepto de omnicanalidad requiere tener todo el know how de la interacción con el usuario de manera centralizada, dirigida y monitoreada, independientemente del canal o medio en el que el usuario lo utilice. Este fue un desafío inmenso, ya que sostener una conversación en cada medio requiere de una gran cantidad de componentes y detalles tecnológicos, específicos de cada medio o canal, pero dirigidos por un hilo conversacional central que esté aislado de dicho medio.
Además, esto permitió asociar un nuevo medio o canal con gran facilidad, ya que toda la estructura conversacional no se ve afectada y solo era necesario agregar los componentes tecnológicos de conexión al nuevo canal.
Desvíos como fuente de aprendizaje
La idea de que el BOT aprenda sólo, no es sencilla. La IA requiere de gran cantidad de interacciones diferentes para alcanzar un grado de madurez que permita resolver lo que se precisa. En este proceso de aprendizaje es necesario evaluar los desvíos, es decir, los casos en que se interpretó una cosa, pero el interlocutor quiso decir otra. El estudio de estos desvíos permite ampliar el grado de comprensión del BOT, y aumentar su capacidad de entendimiento.
Por otro lado, existen situaciones que el BOT no puede tratar y dependiendo de la criticidad de la actividad, habrá que tener prevista una derivación de la conversación a un agente humano, que comprenderá y actuará en consecuencia.
Esta derivación también tiene sus desafíos ya que requiere la inclusión del resumen del diálogo con el BOT y los datos que se hayan podido capturar hasta ese momento, de manera que el agente continúe con la operación.
A su vez, esta interacción con agentes humanos enriquecerá al BOT para que las próximas consultas tengan estas nuevas experiencias y actúen como forma de aprendizaje continua.
Boom de los BOTs en la actualidad
Hoy en día podemos ver los BOTs en todos los medios y canales. Interactuar con ellos, con mayor o menor grado de aceptación del público. La experiencia del usuario se vió afectada por los efectos de la creación de BOTs masivos, pero con escasa capacidad de “entender”, lo que produce fallas en el accionar y decepción del público.
Es necesario comprender que los usuarios, en casi su totalidad, ya han interactuado con algún BOT y han percibido cierta ineficacia en operar con ellos. El desaliento del público es un obstáculo, pero también un desafío para que los BOTs puedan ser percibidos como una gran herramienta con un potencial enorme.
Evolución de cara al futuro próximo
Naturalmente, con la capacidad de proceso de los smartphone, la velocidad de las comunicaciones y, en especial la llegada del 5G junto a la necesidad de inmediatez por parte de los usuarios, es necesario encarar mejoras tecnológicas que den solución a los futuros desafíos.
- Reconocimiento de Emociones: La interacción con el usuario mediante la voz y en lenguaje natural contienen meta mensajes que hasta el momento no se han podido interpretar. Detectar la angustia, ansiedad, desdén, alegría, tristeza en la voz humana podrá aumentar la empatía en la interacción con los BOTs y, eventualmente ir variando la estructura de los diálogos en función de las emociones detectadas. Esta capacidad “humana” de comprender no sólo la intención, sino también, la emoción con la que se manifiesta el usuario es en lo que se está trabajando hoy en día.
- VideoBOTs: Esta evolución del VoiceBOTs permite al usuario interactuar mediante una video llamada, mostrando el avatar del BOTs animado con rasgos humanos y gesticulación acorde. Pero también, debe ser capaz de interpretar la gestualidad del usuario. Aquí los meta mensajes son mucho más ricos, pero también, con más requerimientos tecnológicos para interpretarlos. Las emociones y gestualidad en una conversación por videollamada son componentes clave para comprender al interlocutor y guiarlo en la conversación apropiadamente, respetando el diálogo de la acción que corresponda, pero con los matices ajustados a la situación.
- Interacción con todos los datos: El diálogo con el usuario requiere no solamente la capacidad de entender y procesar lo que precisa, sino también acceder a toda la información disponible que la empresa tenga sobre el individuo que interactúa. Existe gran cantidad de contenido, tanto estructurado como no estructurado, asociados al interlocutor o cliente. El contenido estructurado puede ser lo que está en las bases de datos y representa a la entidad cliente, donde se encuentran los datos de filiación de dicho cliente con la empresa.
El contenido no estructurado puede encontrarse en descripciones dentro de formularios, en reclamos de seguros, órdenes de compra, facturas, remitos, entre muchos otros archivos que puedan ingresar a las empresas en gran cantidad y representan un desafío para la automatización.
El análisis de toda esa información, su indización e interpretación puede ser realizada por motores basados en IA, capaces de “entender” el contenido de cada documento y “asociar” esa información con el cliente.
Esta habilidad representará una ventaja absoluta a la hora de interactuar con el usuario, ya que puede ser utilizada para predecir la necesidad del interlocutor o encauzar conversaciones para que el interlocutor alcance la información que necesita.
- BOTS como asistentes para el cliente interno: La misma tecnología y características técnicas que fueron pensadas de cara al cliente externo, también pueden ser utilizadas de cara al cliente interno o recursos humanos de la compañía. Existe gran variedad de operaciones diarias que realizan las personas en sus trabajos, muchas de ellas, rutinarias o de gran esfuerzo. Poner como asistente virtual a un BOT que ayude a una persona a realizar su trabajo parece una idea natural. Sin embargo, los modelos estructurados que tienen las compañías deberán ser adaptados para que la ayuda de BOTs pueda ser eficiente y alineada con las necesidades de cada actividad.
Asistentes virtuales de Google, Amazon y Apple como extensión del BOT
Estas empresas de tecnología están comenzado a ofrecer servicios de conexión para que los BOTs de las empresas puedan interactuar con los asistentes virtuales masivos. Esto implica que las operaciones de las empresas pueden estar al alcance de una consulta del usuario y operar mediante este medio para resolver una transacción.
Debido a la popularidad de estos asistentes virtuales, son una puerta por la que las empresas pueden implementar nuevos negocios. Para los BOTs que hayan alcanzado la omnicanalidad, esto sólo será un nuevo canal y podrán ingresar a este mundo de manera rápida.