IBM y NASA investigan el impacto del cambio climático con IA

Domingo Vassellati

02/02/2023

La nueva tecnología de modelos fundacionales de IBM aprovecha los datos de NASA Earth Science para la inteligencia geoespacial

IBM y el Marshall Space Flight Center de NASA anuncian una colaboración para utilizar la tecnología de inteligencia artificial (IA) de IBM con el fin de descubrir nuevos conocimientos en el enorme caudal de datos científicos geoespaciales y de la Tierra de la NASA. El trabajo conjunto aplicará por primera vez la tecnología de modelos fundacionales de IA a los datos de los satélites de observación de la Tierra de la NASA.

Los modelos fundacionales son tipos de modelos de IA que se entrenan en un amplio conjunto de datos no etiquetados, que se pueden utilizar para diferentes tareas y permiten aplicar información sobre una situación a otra. Estos modelos avanzaron rápidamente en el campo de la tecnología de procesamiento del lenguaje natural (PLN) en los últimos cinco años, e IBM es pionera en aplicaciones de modelos fundacionales más allá del lenguaje.

Las observaciones de la Tierra que permiten a los científicos estudiar y monitorear nuestro planeta se están recopilando a un ritmo y volumen sin precedentes. Se requieren enfoques nuevos e innovadores para extraer conocimientos de estos vastos recursos de datos. El objetivo de este trabajo es proporcionar a los investigadores una forma más fácil para analizar y obtener información de estos grandes conjuntos de datos. La tecnología de modelos fundacionales de IBM tiene el potencial de acelerar el descubrimiento y el análisis de estos datos para avanzar rápidamente en la comprensión científica de la Tierra y la respuesta a los problemas relacionados con el clima.

IBM y NASA tienen previsto desarrollar varias tecnologías nuevas para extraer información de las observaciones de la Tierra. Uno de los proyectos entrenará un modelo fundacional de inteligencia geoespacial de IBM con el conjunto de datos de Harmonized Landsat-Sentinel-2 (HLS) de la NASA, un registro de la superficie de la Tierra y los cambios en el uso del suelo captados por satélites en órbita terrestre. Mediante el análisis de petabytes de datos satelitales para identificar cambios en la huella geográfica de fenómenos como desastres naturales, rendimiento cíclico de cultivos y hábitats de vida silvestre, esta tecnología de modelos fundacionales ayudará a los investigadores a proporcionar análisis críticos de los sistemas ambientales de nuestro planeta.

Se espera que otro resultado de esta colaboración sea un corpus de literatura de Ciencias de la Tierra en el que se pueda buscar información fácilmente. IBM desarrolló un modelo de procesamiento de lenguaje natural entrenado con casi 300.000 artículos de revistas de Ciencias de la Tierra para organizar la literatura y facilitar el descubrimiento de nuevos conocimientos. Con una de las mayores cargas de trabajo de IA entrenadas en el software Red Hat OpenShift hasta la fecha, el modelo utiliza PrimeQA, un sistema de preguntas y respuestas multilingüe de código abierto de IBM. Más allá de proporcionar un recurso a los investigadores, el nuevo modelo de lenguaje para las Ciencias de la Tierra podría incorporarse a los procesos de gestión y administración de datos científicos de la NASA.

‘La belleza de los modelos fundacionales es que pueden usarse potencialmente para muchas aplicaciones posteriores’, explicó Rahul Ramachandran, senior research scientist del Marshall Space Flight Center de la NASA en Huntsville, Alabama, Estados Unidos. «El desarrollo de estos modelos fundacionales no puede ser abordado por equipos pequeños», agregó. ‘Se necesitan equipos de distintas organizaciones que aporten sus diferentes perspectivas, recursos y habilidades’.

‘Los modelos fundacionales demostraron su eficacia en el procesamiento del lenguaje natural y ahora llegó el momento de expandirlos a nuevos dominios y modalidades importantes para los negocios y la sociedad’, afirma Raghu Ganti, investigador principal de IBM. ‘La aplicación de modelos fundacionales a los datos geoespaciales, secuencias de eventos, series de tiempo y otros factores no lingüísticos dentro de los datos de las Ciencias de la Tierra permitirán que conocimientos e informaciones muy valiosas estén disponibles para un grupo mucho más amplio de investigadores, empresas y ciudadanos. En última instancia, podría facilitar que un mayor número de personas trabajen en algunos de nuestros problemas climáticos más apremiantes’.

En el marco de este acuerdo, otros proyectos posibles entre IBM y NASA incluyen la creación de un modelo fundacional para la predicción meteorológica y climática utilizando MERRA2, un conjunto de datos de observaciones atmosféricas. Esta colaboración forma parte de la Open Source Science Initiative de NASA, un compromiso para construir una comunidad científica abierta, inclusiva, transparente y colaborativa durante la próxima década.