PathWise: planificación a través del modelo mundial para el diseño heurístico automatizado a través de LLM autoevolutivos

Resumen: Los modelos de lenguajes grandes (LLM) han permitido el diseño heurístico automatizado (AHD) para problemas de optimización combinatoria (COP), pero la dependencia de los marcos existentes en reglas evolutivas fijas y plantillas estáticas a menudo conduce a una generación heurística miope, evaluaciones redundantes y razonamiento limitado sobre cómo se deben derivar nuevas heurísticas.

Leer más →

Comentarios desactivados en PathWise: planificación a través del modelo mundial para el diseño heurístico automatizado a través de LLM autoevolutivos

Planificación en línea con aversión al riesgo en POMDP utilizando la función de valor CVaR iterado

Resumen: Estudiamos la planificación sensible al riesgo bajo observabilidad parcial utilizando la medida de riesgo dinámico Valor en Riesgo Condicional Iterado (ICVaR). Se desarrolla un algoritmo de evaluación de políticas para ICVaR con garantías de desempeño en tiempo finito que no dependen de la cardinalidad del espacio de acción.

Leer más →

Comentarios desactivados en Planificación en línea con aversión al riesgo en POMDP utilizando la función de valor CVaR iterado

Reprompting endógeno: alineación cognitiva autoevolutiva para modelos multimodales unificados

Resumen: Los modelos multimodales unificados (UMM) exhiben una sólida comprensión, pero esta capacidad a menudo no logra guiar de manera efectiva la generación. Identificamos esto como una brecha cognitiva: el modelo carece de comprensión de cómo mejorar su propio proceso de generación.

Leer más →

Comentarios desactivados en Reprompting endógeno: alineación cognitiva autoevolutiva para modelos multimodales unificados

Fin del contenido

No hay más páginas por cargar