Resumen: Las advertencias de clima severas oportunas y precisas son críticas para la mitigación de desastres. Sin embargo, los sistemas de pronóstico actual dependen en gran medida de la interpretación de expertos manuales, introduciendo subjetividad y significativas cargas operativas. Con el rápido desarrollo de tecnologías de IA, la “estación meteorológica de IA” está emergiendo gradualmente como una nueva tendencia para predecir eventos climáticos severos. Tres desafíos centrales impiden el desarrollo del sistema climático severo de IA de extremo a extremo: (1) escasez de muestras de eventos climáticos severos; (2) alineación imperfecta entre datos meteorológicos de alta dimensión y advertencias textuales; (3) Los modelos de lenguaje multimodal existentes no pueden manejar datos meteorológicos de alta dimensión y luchar para capturar completamente las dependencias complejas a través de secuencias temporales, niveles de presión vertical y dimensiones espaciales. Para abordar estos desafíos, presentamos a MP-Bench, el primer conjunto de datos multimodal temporal a gran escala para la predicción de eventos climáticos severos, que comprende 421,363 pares de datos meteorológicos múltiples crudos y subtítulos de texto correspondientes, que cubren una amplia gama de escenarios de clima severo en China. Además de este conjunto de datos, desarrollamos un modelo multimodal grande (MMLM) de meteorología que ingiere directamente entradas meteorológicas 4D. Además, está diseñado para acomodar las características únicas del flujo de datos meteorológicos 4D, incorporando tres módulos de fusión adaptativos plug-and-play que permiten la extracción de características dinámicas e integración a través de secuencias temporales, capas de presión vertical y dimensiones espaciales. Extensos experimentos en MP-Bench demuestran que MMLM funciona excepcionalmente bien en múltiples tareas, destacando su efectividad en la comprensión del clima severo y marcando un paso clave para realizar sistemas automatizados de pronóstico meteorológico impulsados por la IA. Nuestro código fuente y conjunto de datos estarán disponibles públicamente.
Publicado Originalme en export.arxiv.org El 11 de agosto de 2025.
Ver Fuente Original
