Una empresa china acaba de lanzar un conjunto de referencia de IA en constante cambio

En este momento estás viendo
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Una empresa china acaba de lanzar un conjunto de referencia de IA en constante cambio

Autor de la entrada:admin
Publicación de la entrada:23 junio, 2025
Categoría de la entrada:Noticias externas

Al probar un modelo de IA, es difícil saber si es razonamiento o simplemente regurgitar las respuestas de sus datos de entrenamiento. Xbench, un nuevo punto de referencia desarrollado por la firma china de capital de riesgo HSG, o Hongshan Capital Group, podría ayudar a evitar ese problema. Eso es gracias a la forma en que evalúa los modelos no solo sobre la capacidad de pasar pruebas arbitrarias, como la mayoría de los otros puntos de referencia, sino también sobre la capacidad de ejecutar tareas del mundo real, lo cual es más inusual. Se actualizará regularmente para tratar de mantenerlo de hoja perenne.

Publicado Originalme en TechnologyReview.com el 23 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web