En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Enseñar a los LLM a preguntar: planificación teórica de categorías de autoconsulta para un razonamiento poco especificado

Enseñar a los LLM a preguntar: planificación teórica de categorías de autoconsulta para un razonamiento poco especificado

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La planificación del tiempo de inferencia con modelos de lenguaje grandes frecuentemente falla bajo observabilidad parcial: cuando las condiciones previas de la tarea crítica no se especifican en el momento de la consulta, los modelos tienden a alucinar hechos faltantes o producir planes que violan restricciones estrictas. Presentamos textbf{Planificación categórica bidireccional de autoconsulta (SQ-BCP)}, que representa explícitamente el estado de la condición previa (texttt{Sat}/texttt{Viol}/texttt{Unk}) y resuelve incógnitas a través de (i) autoconsultas dirigidas a un oráculo/usuario o (ii) hipótesis emph{bridging} que establecen la condición faltante a través de una acción adicional. SQ-BCP realiza una búsqueda bidireccional e invoca un verificador basado en retroceso como un certificado categórico de compatibilidad de objetivos, mientras utiliza puntuaciones basadas en distancia solo para clasificación y poda. Demostramos que cuando el verificador tiene éxito y las restricciones estrictas pasan controles deterministas, los planes aceptados son compatibles con los requisitos del objetivo; bajo ramificación limitada y profundidad de resolución finita, SQ-BCP encuentra un plan de aceptación cuando existe. En todas las tareas de WikiHow y RecipeNLG con condiciones previas retenidas, SQ-BCP reduce las tasas de violación de recursos a textbf{14.9%} y textbf{5.8%} (vs. textbf{26.0%} y textbf{15.7%} para la mejor línea de base), manteniendo al mismo tiempo una calidad de referencia competitiva.

Publicado originalmente en export.arxiv.org el 28 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web