Resumen: Los avances recientes en grandes modelos de razonamiento (LRMS) han mostrado capacidades impresionantes en el razonamiento matemático y lógico. Sin embargo, los LRM actuales rara vez admiten ignorancia o responden con “No sé”. En cambio, a menudo producen respuestas incorrectas mientras muestran una confianza indebida, lo que plantea preocupaciones sobre su confiabilidad objetiva. En este trabajo, identificamos dos patrones de razonamiento patológico caracterizados por el pensamiento demasiado que contribuye a las respuestas exageradas e incorrectas: adivinanzas de último minuto y espiral de segundo pensamiento. Para abordar estos temas, proponemos el marco novedoso de barril, que promueve el razonamiento objetivo conciso y con límites. Nuestros experimentos muestran que la capacitación en barril aumenta la confiabilidad de Deepseek-R1-Distill-Llama-8B de 39.33% a 61.48%, al tiempo que logran una precisión comparable a los modelos Finetic en los datos de razonamiento generados por R1. Estos resultados demuestran que nuestro estudio piloto es inspirador para construir un sistema más confiable y objetivo 2 LRMS.

Publicado Originalme en rss.arxiv.org El 20 de mayo de 2025.
Ver Fuente Original

Barrel: razonamiento consciente de los límites para LRMs objetivos y confiables

admin

Industrial Transformation México 2025

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Dar a los agentes de IA acceso a criptomonedas y contratos inteligentes crea nuevos vectores de daño de IA

Difusión rápida de Monte Carlo: Speedup 100x a través de una planificación escasa paralela

Construcción de MLLM oftálmico para colaboración en el diagnóstico de posicionamiento a través del razonamiento clínico de la cadena cognitiva

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido