A través de los ojos del juez: los rastros de pensamiento inferidos mejoran la confiabilidad de los evaluadores de LLM

Resumen: Los modelos de lenguaje grande (LLM) se utilizan cada vez más como evaluadores para tareas de evaluación. Sin embargo, su confiabilidad suele ser limitada para tareas subjetivas, cuando los juicios humanos implican un razonamiento sutil más allá de las etiquetas de anotación.

Leer más →

Comentarios desactivados en A través de los ojos del juez: los rastros de pensamiento inferidos mejoran la confiabilidad de los evaluadores de LLM

El agente FM

Resumen:Los modelos de lenguajes grandes (LLM) están catalizando el desarrollo de agentes de investigación de IA autónomos para descubrimientos científicos y de ingeniería.

Leer más →

Comentarios desactivados en El agente FM

Juego con andamios simbólicos: diseño de indicaciones sensibles a los roles para el diálogo generativo de NPC

Resumen: Los modelos de lenguaje grande (LLM) prometen transformar los juegos interactivos al permitir que personajes no jugadores (NPC) mantengan diálogos sin guión. Sin embargo, aún no está claro si las indicaciones restringidas realmente mejoran la experiencia del jugador. Investigamos esta cuestión a través de The Interview, un juego de detectives basado en voz impulsado por GPT-4o.

Leer más →

Comentarios desactivados en Juego con andamios simbólicos: diseño de indicaciones sensibles a los roles para el diálogo generativo de NPC

Fin del contenido

No hay más páginas por cargar