Skip to article frontmatterSkip to article content

Taller Radares Meteorológicos 📡

Del Dato al Impacto: Zarr y la Nueva Era de Datos Abiertos en la Nube para la Gestión del Riesgo de Desastres

Authors
Affiliations
Universidad de Illinois, Urbana-Champaign, EE.UU.
Unidad Nacional para la Gestión del Riesgo de Desastres (UNGRD), Colombia
Unidad Nacional para la Gestión del Riesgo de Desastres (UNGRD), Colombia

El crecimiento acelerado de datos generados por redes de radar meteorológico, por los modelos numéricos de pronóstico, y por los modelos hidrológicos distribuidos plantean un desafío de escala y acceso para la gestión de riesgos de desastres. La dispersión de estos datos en infraestructuras locales de difícil acceso dificulta su aprovechamiento, haciendo necesaria la migración a la nube para garantizar disponibilidad y escalabilidad.

Para un acceso rápido y eficiente en la nube, no basta con trasladar archivos NetCDF, HDF5, o formatos binarios (propietarios) diseñados para entornos locales y que requieren su descarga completa para su procesamiento generando duplicados, elevando costos, y dificultando la reproducibilidad de los análisis. Se requiere superar estas limitaciones que restringen el acceso simultáneo, escalable y eficiente a los datos.

En respuesta a estos desafíos, existen formatos modernos como Zarr, capaces de almacenar grandes volúmenes de datos en la nube de forma nativa. Su organización en fragmentos o “chunks” independientes, que separan metadatos de información, facilita consultas rápidas y acceso selectivo sin necesidad de transferir archivos completos, habilitando acceso tipo “data streaming”. Al permitir trabajar directamente sobre pequeños fragmentos, Zarr favorece la escalabilidad del análisis y el procesamiento paralelo eficiente de grandes conjuntos de datos distribuidos.

Para ilustrar las ventajas de este nuevo paradigma de almacenamiento y acceso a datos optimizados para la nube, aplicaremos soluciones basadas en principios de ciencia abierta FAIR al manejo de datos de radares meteorológicos de Colombia y de Estados Unidos (NEXRAD). Utilizando el formato Zarr junto con Xarray y Xradar, desarrollaremos un modelo jerárquico y abierto, adaptado a entornos de almacenamiento de objetos, que permite consultas eficientes, actualizaciones dinámicas y análisis escalables sobre series de tiempo de grandes volúmenes de datos.

Esta implementación demostró mejoras de hasta 210 veces en los tiempos de procesamiento en comparación con enfoques tradicionales, incluso utilizando configuraciones de hardware estándar. Los resultados evidencian el potencial de los formatos cloud-native para transformar la gestión de datos científicos a gran escala, promoviendo su apertura, interoperabilidad y reutilización en áreas críticas como la gestión del riesgo y la investigación climática.

Información del evento

Materiales y recursos

Cierre

Cierre del evento{width=“250”}