ORCHID: Clasificación aumentada de recuperación orquestada con toma de decisiones inteligente humana en el circuito para propiedades de alto riesgo

Resumen: La clasificación de propiedades de alto riesgo (HRP) es fundamental en los sitios del Departamento de Energía de EE. UU. (DOE), donde los inventarios incluyen equipos sensibles y, a menudo, de doble uso. El cumplimiento debe seguir las reglas en evolución designadas por diversas políticas de control de exportaciones para tomar decisiones transparentes y auditables.

Leer más →

Comentarios desactivados en ORCHID: Clasificación aumentada de recuperación orquestada con toma de decisiones inteligente humana en el circuito para propiedades de alto riesgo

POLIS-Bench: Hacia una evaluación multidimensional de LLM para tareas de políticas bilingües en escenarios gubernamentales

Resumen:Presentamos POLIS-Bench, el primer conjunto de evaluación riguroso y sistemático diseñado para LLM que operan en escenarios de políticas gubernamentales bilingües. En comparación con los puntos de referencia existentes, POLIS-Bench introduce tres avances importantes.

Leer más →

Comentarios desactivados en POLIS-Bench: Hacia una evaluación multidimensional de LLM para tareas de políticas bilingües en escenarios gubernamentales

Agentes de razonamiento en tiempo real en entornos en evolución

Resumen: Los agentes en el mundo real deben emitir juicios no sólo lógicos sino también oportunos. Esto requiere una conciencia continua del entorno dinámico: surgen peligros, surgen oportunidades y otros agentes actúan, mientras el razonamiento del agente aún se está desarrollando.

Leer más →

Comentarios desactivados en Agentes de razonamiento en tiempo real en entornos en evolución

Fin del contenido

No hay más páginas por cargar