Thor: Optimización jerárquica integrada en herramientas a través de RL para el razonamiento matemático
Resumen: Grandes modelos de idiomas (LLM) han hecho un progreso notable en el razonamiento matemático, pero aún continúan luchando con tareas de alta precisión como el cálculo numérico y la manipulación simbólica formal. La integración de herramientas externas ha surgido como un enfoque prometedor para cerrar esta brecha.
Leer más →