Resumen:En este artículo, señalamos que el objetivo de los algoritmos de recuperación es alinearse con el LLM, lo cual es similar al objetivo de destilación del conocimiento en los LLM.
Leer más →
Resumen: La demostración automatizada de teoremas en geometría euclidiana, particularmente para problemas de nivel de la Olimpiada Internacional de Matemáticas (OMI), sigue siendo un desafío importante y un importante foco de investigación en Inteligencia Artificial.
Leer más →
Resumen: La calidad de los conjuntos de datos juega un papel importante en la alineación del modelo de lenguaje grande (LLM). Sin embargo, al recopilar comentarios humanos, el cambio de preferencias es omnipresente y provoca corrupción en la anotación de datos; El problema requiere algoritmos de alineación con mayor robustez frente a posibles pares invertidos.
Leer más →