Noticias externas Archivos | Página 25 de 363 | Asociación Mexicana del Internet de las Cosas A.C.

Lee más sobre el artículo Optimización de preferencias estables para LLM: un enfoque bilevel más allá de la optimización de preferencias directas

Optimización de preferencias estables para LLM: un enfoque bilevel más allá de la optimización de preferencias directas

Resumen: La optimización de preferencias directas (DPO) se ha convertido en una alternativa popular y eficiente al modelado de recompensas y al aprendizaje de refuerzo para alinear modelos lingüísticos con preferencias humanas. A pesar de su éxito empírico, las propiedades teóricas y las limitaciones intrínsecas de DPO permanecen subexploradas.

Leer más →

Comentarios desactivados

10 julio, 2025

Lee más sobre el artículo Boost: muestreo adaptativo fuera de distribución para la mitigación de sesgos en redes neuronales convolucionales estilísticas

Noticias externas

Boost: muestreo adaptativo fuera de distribución para la mitigación de sesgos en redes neuronales convolucionales estilísticas

Resumen: El tema generalizado del sesgo en la IA presenta un desafío significativo para la clasificación de pintura, y se está volviendo más grave a medida que estos sistemas se integran cada vez más en tareas como la curación y la restauración del arte.

Leer más →

Comentarios desactivados

10 julio, 2025

Noticias externas

Planqa: un punto de referencia para el razonamiento espacial en LLM utilizando representaciones estructuradas

Resumen: Introducimos a PlanQA, un punto de referencia de diagnóstico para evaluar el razonamiento geométrico y espacial en modelos de gran lenguaje (LLM). Planqa se basa en representaciones estructuradas de escenas interiores, como cocinas, salas de estar y habitaciones, codificadas en un formato simbólico (por ejemplo, JSON, diseños XML).

Leer más →

Comentarios desactivados

10 julio, 2025

Optimización de preferencias estables para LLM: un enfoque bilevel más allá de la optimización de preferencias directas

Boost: muestreo adaptativo fuera de distribución para la mitigación de sesgos en redes neuronales convolucionales estilísticas

Planqa: un punto de referencia para el razonamiento espacial en LLM utilizando representaciones estructuradas

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto