Resumen: Este documento presenta un marco de evaluación para los sistemas de IA de agente en contextos de negociación de misión crítica, abordando la necesidad de agentes de IA que puedan adaptarse a diversos operadores humanos y partes interesadas.
Leer más →
Resumen: Este artículo presenta un sistema de aprendizaje de refuerzo profundo (DRL) para Xiangqi (ajedrez chino) que integra redes neuronales con la búsqueda de árboles de Monte Carlo (MCTS) para permitir la autoestima estratégica y la autoinforme.
Leer más →
Resumen: Introducimos SLR, un marco de extremo a extremo para la evaluación sistemática y la capacitación de modelos de idiomas grandes (LLM) a través del razonamiento lógico escalable. Dada la especificación de tareas de un usuario, SLR permite una síntesis escalable y automatizada de tareas de razonamiento inductivo con dificultad controlada con precisión.
Leer más →