El punto de referencia de Nazonazo: una prueba rentable y extensible del razonamiento basado en información en LLMS

Resumen: La saturación y la contaminación de referencia socavan la confianza en la evaluación de LLM. Presentamos a Nazonazo, un punto de referencia rentable y extensible construido con acertijos de niños japoneses para probar el razonamiento basado en información.

Leer más →

Comentarios desactivados en El punto de referencia de Nazonazo: una prueba rentable y extensible del razonamiento basado en información en LLMS

Racionanomalía: Detección de anomalías log con racionalidad a través de la cadena de pensamiento y el aprendizaje de refuerzo

Resumen: Los registros constituyen una forma de evidencia que indica el estado operativo de los sistemas de software. La detección automatizada de anomalías de registro es crucial para garantizar la confiabilidad de los sistemas de software modernos.

Leer más →

Comentarios desactivados en Racionanomalía: Detección de anomalías log con racionalidad a través de la cadena de pensamiento y el aprendizaje de refuerzo

Comprender el proceso de pensamiento de los modelos de razonamiento: una perspectiva de la teoría del episodio de Schoenfeld

Resumen: Mientras que los grandes modelos de razonamiento (LRMS) generan un razonamiento extenso de la cadena de pensamiento, nos faltan un marco de principios para comprender cómo se estructuran estos pensamientos.

Leer más →

Comentarios desactivados en Comprender el proceso de pensamiento de los modelos de razonamiento: una perspectiva de la teoría del episodio de Schoenfeld

Fin del contenido

No hay más páginas por cargar