IBM avanza la capacidad de Watson para comprender el lenguaje de los negocios

IBM anuncia nuevas tecnologías de IBM Watson diseñadas para ayudar a las organizaciones a comenzar a identificar, comprender y analizar con mayor claridad algunos de los mayores desafíos del lenguaje humano para obtener mejores insights.

Las nuevas tecnologías representan la primera comercialización de capacidades esenciales de procesamiento del lenguaje natural (Natural Language Processing – NLP) presentes en el proyecto de investigación Project Debater de IBM Research, el único sistema de Inteligencia Artificial (IA) capaz de debatir con humanos sobre temas complejos.

Por ejemplo, se define una nueva función avanzada de análisis de sentimientos para identificar y analizar modismos y coloquialismos por primera vez. Frases como «hot under the collar», que en español algo similar ocurriría con la frase «la sangre en el ojo», han desafiado los sistemas de IA porque son difíciles de detectar por algoritmos. Con el análisis avanzado de sentimientos, las compañías pueden comenzar a analizar esos datos de lenguaje con las APIs de Watson, para obtener una comprensión más holística de sus operaciones. Además, IBM está trayendo tecnología de su división de investigación, IBM Research, para comprender documentos comerciales, como archivos PDF y contratos, para agregar también a sus modelos de IA.

Rob Thomas, Gerente General de IBM Data and AI explica: ‘El lenguaje es una herramienta para expresar pensamientos y opiniones, así como una herramienta para obtener información’. ‘Es por eso que estamos cosechando tecnología del Proyecto Debater e integrándola en Watson, para permitir a las empresas capturar, analizar y comprender más del lenguaje humano y comenzar a transformar la forma en que utilizan el capital intelectual que está codificado en los datos’.

Hoy, IBM anuncia sus planes de integrar las tecnologías del proyecto de investigación Project Debater a Watson durante el transcurso de este año, para mejorar la capacidad de sus clientes de explorar el lenguaje natural:

A- Análisis – Advanced Sentiment Analysis (análisis avanzado de sentimientos). IBM ha mejorado el análisis de sentimientos para identificar y comprender mejor las construcciones de palabras complicadas, como frases y modismos, y los llamados shifters de sentimientos, que son combinaciones de palabras que juntas adquieren un nuevo significado, como la expresión en inglés «hardly helpful», en el que «hard» no tiene sentido de «difícil» sino de «poco». Esta tecnología se integrará con Watson Natural Language Understanding este mes, en Inglés, y hasta fin de año en Español. Además, estamos anunciando una nueva tecnología de clasificación que permitirá a los clientes crear modelos de inteligencia artificial para clasificar más fácilmente las cláusulas que se producen en los documentos comerciales, como los contratos de adquisición. Basado en la tecnología de calificación con deep learning de Project Debater, las nuevas características pueden aprender de unos pocos cientos de muestras, para hacer nuevas calificaciones de manera rápida y fácil. Está planeado que sea incluido a Watson Discovery a finales de este año.

B- Briefs: Summarization (resumen). Esta tecnología extrae datos textuales de varias fuentes para proporcionar a los usuarios un resumen de lo que se dice y escribe sobre un tema específico. Se usó una versión inicial de Summarization en The GRAMMYS de este año, para analizar más de 18 millones de artículos, blogs y biografías para producir información digerible sobre cientos de artistas y celebridades de GRAMMY. Los datos se usaron en la transmisión en vivo de la alfombra roja, fotos y videos on-demand en www.grammy.com, para proporcionar a los fanáticos un contexto más amplio sobre los temas principales de la noche. Está planeado que sea incluido a IBM Watson Natural Language Understanding a finales de este año.

C- Clustering – Advanced Topic Clustering (agrupación avanzada de temas). Basado en los insights adquiridos del Proyecto Debater, las nuevas técnicas de agrupación de temas permitirán a los usuarios «agrupar» los datos recibidos para crear «temas» con información relacionada, para que puedan ser analizados. La técnica, que está planeada que sea incluida a Watson Discovery a finales de este año, también permitirá a los expertos personalizar y ajustar temas para reflejar el lenguaje de compañías o industrias específicas, como seguros, salud y manufactura.

Salir de la versión móvil