SciRisk-Bench: un punto de referencia consciente de la dimensión del riesgo para la seguridad de AI4Science

Resumen: Los modelos de lenguajes grandes (LLM) están cada vez más integrados en los flujos de trabajo de IA para la ciencia (AI4Science), desde la respuesta a preguntas científicas y el análisis de la literatura hasta la planificación de laboratorio y el descubrimiento autónomo.

Leer más →

Comentarios desactivados en SciRisk-Bench: un punto de referencia consciente de la dimensión del riesgo para la seguridad de AI4Science

Destilación de continuación guiada por habilidades para agentes GUI

Resumen:La mejora de los agentes GUI normalmente se basa en la clonación de comportamientos en trayectorias expertas. Sin embargo, a medida que la política actual se desvía de la política de expertos, inevitablemente encuentra estados fuera de trayectoria inducidos por la política durante la ejecución de circuito cerrado, es decir, estados que quedan fuera de las trayectorias de expertos.

Leer más →

Comentarios desactivados en Destilación de continuación guiada por habilidades para agentes GUI

Planificación predictiva de modelos generativos para la navegación en entornos parcialmente observables

Resumen:La navegación en entornos parcialmente observables presenta un desafío importante para los agentes autónomos, ya que requiere una toma de decisiones eficaz con información sensorial limitada en entornos desconocidos.

Leer más →

Comentarios desactivados en Planificación predictiva de modelos generativos para la navegación en entornos parcialmente observables

Fin del contenido

No hay más páginas por cargar