TemporalBench: un punto de referencia para evaluar agentes basados ​​en LLM en tareas de series temporales contextuales y basadas en eventos

Resumen: No está claro si un desempeño sólido en el pronóstico refleja una comprensión temporal genuina o la capacidad de razonar en condiciones contextuales e impulsadas por eventos. Presentamos TemporalBench, un punto de referencia multidominio diseñado para evaluar el comportamiento de razonamiento temporal en entornos informativos cada vez más ricos.

Leer más →

Comentarios desactivados en TemporalBench: un punto de referencia para evaluar agentes basados ​​en LLM en tareas de series temporales contextuales y basadas en eventos

¿Cuándo pensar rápido y lento? AMOR: puerta metacognitiva basada en entropía para el cambio dinámico de atención SSM

Resumen: Los transformadores asignan cálculos uniformes a cada posición, independientemente de la dificultad. Los modelos de espacio de estados (SSM) ofrecen alternativas eficientes, pero tienen dificultades para recuperar información precisa a largo plazo.

Leer más →

Comentarios desactivados en ¿Cuándo pensar rápido y lento? AMOR: puerta metacognitiva basada en entropía para el cambio dinámico de atención SSM

Fin del contenido

No hay más páginas por cargar