Resumen: Los modelos de lenguaje grande (LLM) se utilizan cada vez más como evaluadores para tareas de evaluación. Sin embargo, su confiabilidad suele ser limitada para tareas subjetivas, cuando los juicios humanos implican un razonamiento sutil más allá de las etiquetas de anotación.
Leer más →
Resumen:Los modelos de lenguajes grandes (LLM) están catalizando el desarrollo de agentes de investigación de IA autónomos para descubrimientos científicos y de ingeniería.
Leer más →
Resumen: Los modelos de lenguaje grande (LLM) prometen transformar los juegos interactivos al permitir que personajes no jugadores (NPC) mantengan diálogos sin guión. Sin embargo, aún no está claro si las indicaciones restringidas realmente mejoran la experiencia del jugador. Investigamos esta cuestión a través de The Interview, un juego de detectives basado en voz impulsado por GPT-4o.
Leer más →