El punto de referencia de Nazonazo: una prueba rentable y extensible del razonamiento basado en información en LLMS
Resumen: La saturación y la contaminación de referencia socavan la confianza en la evaluación de LLM. Presentamos a Nazonazo, un punto de referencia rentable y extensible construido con acertijos de niños japoneses para probar el razonamiento basado en información.
Leer más →