Desde 2009 hasta 2019, la Operación IceBridge de la NASA envió vuelos de observación sobre el Ártico, la Antártida y Alaska. Esos 11 años de vuelos produjeron datos detallados sobre las dimensiones y los flujos de nieve, hielo marino, glaciares y capas de hielo gracias a una mezcla de radares, láseres, cámaras, gravímetros, magnetómetros y otros instrumentos. Ahora, los investigadores de la Universidad de Maryland, Condado de Baltimore (UMBC) están utilizando IA para acelerar el análisis de esa avalancha de datos.
Específicamente, los investigadores se propusieron procesar los datos de radar recopilados de las regiones polares, datos que, en ausencia de análisis avanzados, pueden tardar meses o años en analizarse de manera significativa. «Los datos masivos de radar son muy difíciles de extraer y comprender simplemente mediante el uso de técnicas manuales», dijo Maryam Rahnemoonfar, profesora asociada de sistemas de información y autora principal del artículo, en una entrevista con Morgan Zepp de UMBC.
Para acelerar ese proceso, los investigadores utilizaron un algoritmo de aprendizaje profundo de múltiples escalas que trazó los límites de las capas de nieve, lo que permitió el análisis de áreas cubiertas de nieve. El algoritmo ha ayudado al equipo a eliminar los datos ruidosos, lo que inhibe técnicas como el aprendizaje por transferencia. Las redes neuronales entrenadas para detectar esos límites de nieve en imágenes ópticas solo experimentaron un éxito limitado al intentar detectar los mismos límites en imágenes de radar. Luego, los investigadores encontraron que si los algoritmos se entrenaron en las imágenes de radar desde el principio, arrojaron «resultados mucho mejores».
«Las redes neuronales profundas deben su éxito a la disponibilidad de datos etiquetados masivos», escribió el equipo. «Sin embargo, en muchos problemas del mundo real, incluso cuando se dispone de un gran conjunto de datos, los métodos de aprendizaje profundo han mostrado menos éxito, debido a causas como la falta de un gran conjunto de datos etiquetados, la presencia de ruido en los datos o la falta de datos».