Resumen: El diseño rápido efectivo es esencial para mejorar las capacidades de planificación de los agentes impulsados por el modelo de idioma grande (LLM).
Leer más →
Resumen: las instrucciones del sistema (SIS), o las indicaciones del sistema, son fundamentales para guiar modelos de lenguaje grandes (LLM), pero la elaboración manual es intensiva en recursos y, a menudo, es subóptima. Los métodos automatizados existentes generan frecuentemente “indicaciones suaves” no humanos, sacrificando la interpretabilidad.
Leer más →
Resumen: En este documento, los LLM tienen la tarea de completar una cuestionario imposible, mientras están en una caja de arena, monitoreadas, se informan sobre estas medidas e instruyen a no hacer trampa. Algunos LLM de Frontier hacen trampa de manera consistente e intentan eludir las restricciones a pesar de todo.
Leer más →