Resumen: Las implementaciones modernas asignan cada vez más al gran cómputo de tiempo de prueba (miles de tokens o muchas expansiones de nodos) para aumentar la confiabilidad. Bajo tales presupuestos, la búsqueda estándar de estilo de árbol de pensamiento exhibe dos patologías: la saturación de amplitud (las muestras adicionales producen principalmente duplicados casi casi, por lo que el ancho deja de crecer) y la miopía de profundidad (ruidosas ramas de Prune de utilidades de horizonte cortos cuyo pago aparece después de algunos pasos más). Proponemos el árbol de pensamientos lateral (LTOT), un controlador de entrega que separa la utilidad de la consistencia lógica y trata la baja utilidad pero los candidatos consistentes como activos en lugar de desechos. La frontera se divide en líneas principales (candidatos de alta utilidad utilizados para la explotación) y laterales (candidatos consistentes e inicialmente de baja utilidad que reciben sondas cortas y baratas antes del juicio). LTOT explora los laterales a través de carreras laterales con cortocircuito (LR-SC): una raza de fallecimiento sucesiva limitada que extiende pequeñas sondas en un conjunto lateral muy ancho, utiliza umbrales conscientes de ancho con repetición a confirm e inmediatamente promueve una rama una vez que su sobre limpia la barra de la línea principal; Las líneas principales se mantienen intencionalmente estrechas, por lo que el cálculo excedente se invierte donde el ancho es barato. Probamos un costo lateral pseudolíneo $ theta (n_0 log _ { eta} n_0) $ con logarítmicamente muchos peldaños (ancho lateral inicial $ N_0 $; factor de sacrificio $ eta> 1 $), en contraste con el crecimiento exponencial de líneas principales sin límites. Las evaluaciones empíricas sobre las tareas de referencia están en preparación y se agregarán en una revisión futura. En resumen, LTOT convierte los grandes presupuestos en el tiempo de prueba en diversidad de principios al tiempo que preserva la disciplina de promoción, mitigando la saturación y la miopía sin inflar el cálculo.
Publicado Originalme en export.arxiv.org El 2 de octubre de 2025.
Ver Fuente Original
