Con datos del satélite “Daichi 2”, se desarrolló un modelo basado en SAR especializado para Japón: JAXA

Tokio, Japón, Asia.- Como resultado de la investigación de su acuerdo de colaboración, la Agencia de Exploración Aeroespacial de Japón (en adelante, «JAXA») y el Instituto Nacional de Ciencia y Tecnología Industrial Avanzada (en adelante, «AIST») han construido un modelo base SAR*4 especializado para la masa terrestre de Japón, utilizando datos del modo de observación de alta resolución de 3 m que se observan rutinariamente sobre Japón mediante PALSAR-2, un radar de apertura sintética (SAR)*3 a bordo del DAICHI-2*2 (ALOS-2) de JAXA.

Este resultado de investigación fue logrado por el Instituto de Investigación de Plataforma Inteligente AIST (Nevrez Imamoglu, investigador principal, Ali Caglayan, investigador principal, Kamiyama Toru, líder del grupo de investigación, Tsutsumi Chiaki, gerente de investigación jefe) mediante la importación y el análisis de datos de observación de DAICHI-2 en el sistema de computación en la nube de IA a gran escala de AIST «ABCI», logrando un aprendizaje a gran escala y construyendo un modelo básico.

Inicialmente, esperamos que el modelo base y los productos de alto valor añadido sean utilizados por investigadores, incluidos los de JAXA y AIST. Sin embargo, al utilizar este modelo base, esperamos reducir la barrera para la interpretación de las imágenes SAR, que requiere conocimientos especializados, y ampliar el uso del SAR a una gama más amplia de personas.

Teniendo en cuenta las características de la superficie terrestre de Japón, como el hecho de que el 70% de la tierra está cubierta de bosques, los sitios que se utilizarían para la capacitación se seleccionaron con antelación para evitar sesgos en la capacitación hacia usos y tipos de cobertura terrestres específicos, y para igualar las proporciones de uso y cobertura terrestre incluidas en los datos de capacitación. Los datos de observación de PALSAR-2 cubren todo el país, pero al extraer parches de imágenes que incluyen los puntos seleccionados, desarrollamos un conjunto de datos de entrenamiento que refleja diversos usos y coberturas de la tierra. Al utilizar este conjunto de datos para realizar un aprendizaje no supervisado a gran escala*5, construimos un modelo fundamental para datos SAR especializados en tierras nacionales. Cuando se realizó una estimación del uso y la cobertura del suelo mediante aprendizaje por transferencia, los resultados de la estimación fueron significativamente más precisos que los obtenidos utilizando un modelo base con un conjunto de datos de aprendizaje creado aleatoriamente, o los resultados obtenidos sin utilizar el modelo base en absoluto, y se confirmó que el modelo base que utiliza un conjunto de datos estandarizados exhibe un alto desempeño.

Antecedentes sociales del desarrollo

SAR es una tecnología de teledetección que utiliza microondas y, al utilizar tecnología de apertura sintética con satélites y aeronaves, se pueden obtener imágenes de alta resolución como datos de observación, de día o de noche. En particular, las microondas en la banda L, que tiene un rango de frecuencia de 1 GHz a 2 GHz, tienen una alta transparencia al vapor de agua en el aire y la vegetación y, por lo tanto, se utilizan cada vez más para monitorear cambios topográficos y comprender la situación durante desastres en países boscosos como Japón. El satélite «Daichi 2» (ALOS-2) de JAXA está equipado con el SAR de banda L PALSAR-2, y continúa observando el mundo, incluido Japón, independientemente del clima o la hora del día.

Por otra parte, existen desafíos para ampliar el uso del SAR a una gama más amplia de campos. La interpretación de los datos SAR requiere conocimientos especializados, por lo que se está introduciendo cada vez más tecnología de IA, pero los cálculos a gran escala y la adquisición de grandes cantidades de datos son costosos. Se podría considerar la introducción de un modelo fundacional para resolver este problema. La construcción de un modelo fundamental requiere grandes cantidades de datos y cálculos a gran escala, pero una vez construido, se puede utilizar como base para construir modelos de IA que puedan realizar una variedad de tareas con un aprendizaje mínimo.

Antecedentes de la investigación

Hasta ahora, no existía un modelo básico para los datos SAR de PALSAR-2 en el satélite «Daichi-2» de JAXA, en particular los abundantes datos SAR obtenidos a través de observaciones de alta resolución de tierras japonesas. AIST y JAXA firmaron un «Acuerdo sobre investigación y desarrollo de métodos de análisis de IA para datos satelitales» y realizaron cálculos a gran escala de datos PALSAR-2 utilizando «ABCI», un sistema de computación en la nube de IA a gran escala propiedad de AIST. Este logro fue posible gracias al Proyecto de Presupuesto de Políticas de AIST «Investigación y desarrollo en modelos de infraestructura de IA generativa en el dominio físico». Este resultado se logró utilizando ABCI 3.0 proporcionado por AIST y AIST Solutions con el apoyo del programa «ABCI 3.0 Development Acceleration Use».

Contenidos de la investigación

PALSAR-2, instalado a bordo del DAICHI-2, observa minuciosamente toda la superficie terrestre de Japón en modo de alta resolución, como 3 m. Además, estas observaciones se realizan periódicamente para detectar movimientos de la corteza causados ​​por terremotos y otros eventos, y los datos que cubren casi todo el país se actualizan aproximadamente cuatro veces al año de acuerdo con la órbita del DAICHI-2. Los resultados de este estudio se lograron realizando un entrenamiento previo a gran escala utilizando MixMAE※7, un derivado de Masked Auto Encoder (MAE)※6, un método de aprendizaje no supervisado desarrollado para imágenes, y construyendo un modelo base a partir de los abundantes datos SAR observados en el país.

En las observaciones SAR, se emiten ondas de radio desde el sensor hacia la Tierra, y se observa el estado de la superficie de la tierra o del agua midiendo la intensidad de las ondas de radio que se reflejan desde la superficie de la tierra o del agua y regresan al sensor. Debido a que las imágenes SAR son diferentes de las longitudes de onda que ve el ojo humano, son significativamente diferentes de las imágenes familiares como las de los satélites meteorológicos, y se requieren conocimientos especializados para interpretar las imágenes. La aplicación de IA a imágenes SAR para ayudar en la interpretación se está volviendo más común, pero desarrollar IA desde cero para cada propósito plantea desafíos en términos de costos, incluida la preparación de datos y los cálculos necesarios para el entrenamiento de la IA. Al completar el aprendizaje básico de antemano, el modelo base se puede adaptar a diversos problemas con solo un aprendizaje adicional menor (llamado aprendizaje por transferencia).

El rendimiento del modelo fundamental está fuertemente influenciado no sólo por la cantidad de datos sino también por la diversidad de información contenida en ellos. Por ejemplo, el 70% de la superficie terrestre de Japón está cubierta de bosques, por lo que si los datos se entrenan de forma aleatoria, se espera que el conocimiento esté sesgado hacia los bosques. En realidad, el país está formado por una variedad de tipos de tierras, incluidos bosques, zonas urbanas, ríos y zonas cultivadas. Por lo tanto, tomando como referencia los datos ya disponibles sobre el uso y la cobertura del suelo del país, designamos por igual bosques, áreas urbanas, cuerpos de agua (ríos, lagos, etc.) y áreas cultivadas. Para preparar los datos para el entrenamiento, dividimos las imágenes en pequeñas imágenes de 256 x 256 píxeles (parches de imagen) centradas en puntos específicos y preparamos más de 300.000 piezas de datos de entrenamiento. Además, para reducir los efectos del ruido de moteado*8 específico del SAR y las señales extremadamente fuertes debidas a las condiciones de reflexión, ideamos una función de pérdida que ignora los efectos de las áreas con una intensidad de ondas de radio reflejadas extremadamente fuerte. El modelo base se construyó realizando un aprendizaje no supervisado utilizando el conjunto de datos de entrenamiento creado y una función de pérdida diseñada.

Si bien el modelo base no es capaz de manejar un propósito específico tal como está, se puede utilizar para una variedad de propósitos realizando aprendizaje por transferencia en una pequeña cantidad de conjuntos de datos adaptados al propósito. En este estudio, realizamos aprendizaje por transferencia para permitir la estimación del uso y la cobertura del suelo, con el objetivo de evaluar el desempeño del modelo básico (Figura 3).

Cuando se utilizó el modelo fundamental, los datos SAR a gran escala ya habían sido entrenados previamente y ya se había extraído información útil para comprenderlos. Esto resultó en una mejora del 10% o más en la precisión en comparación con los modelos que no utilizaron el modelo fundamental para estimar el uso y la cobertura terrestre.

Planes futuros

En el futuro, utilizaremos el modelo básico que hemos construido para llevar a cabo diversas aplicaciones como la detección de desastres y la detección de cambios urbanos, acumulando ejemplos prácticos de datos SAR y evaluando el rendimiento del modelo básico. Además, si bien hasta ahora ha sido difícil para la IA convertir la información que ha obtenido de las imágenes en explicaciones lingüísticas fáciles de entender para los humanos, el modelo fundamental facilita la integración de diferentes tipos de información, como el lenguaje y las imágenes, o el lenguaje y la acústica, lo que permite explicar los resultados de la interpretación de los datos SAR en lenguaje. Además, se espera que la explicación expresada en el lenguaje pueda ser entendida por un modelo de lenguaje separado, que puede usarse para ayudar con tareas tales como determinar si una observación debe repetirse. Estos esfuerzos harán que la comprensión de los datos SAR, que antes requerían conocimientos especializados, sea más intuitiva y rápida, y nuestro objetivo es ampliar aún más el uso del SAR en el futuro.

Acerca de las cifras utilizadas en este comunicado de prensa

Esta figura es una cita y modificación del artículo original. Respecto del uso de derechos de autor, asegúrese de indicar claramente la fuente a continuación.

Presentado en la 78.ª Conferencia Académica de la Sociedad de Teledetección de Japón (primavera de 2025) Artículo publicado: Tarea de segmentación de imágenes y preentrenamiento autosupervisado en imágenes SAR de canal único ALOS2 Autores: Nevrez Imamoglu, Ali Caglayan, Toru Kouyama

Comparte esta noticia

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *