ValuePilot: un marco de dos fases para la toma de decisiones basada en valores

Resumen:La toma de decisiones personalizada es esencial para la interacción entre humanos y IA, lo que permite a los agentes de IA actuar en alineación con las preferencias de valor de los usuarios individuales. A medida que los sistemas de IA se expanden hacia aplicaciones del mundo real, adaptarse a valores personalizados más allá de la finalización de tareas o la alineación colectiva se ha convertido en un desafío crítico. Abordamos esto proponiendo un enfoque basado en valores para la toma de decisiones personalizada. Los valores humanos sirven como señales estables y transferibles que respaldan un comportamiento consistente y generalizable en todos los contextos. En comparación con los paradigmas orientados a tareas impulsados por recompensas e incentivos externos, la toma de decisiones basada en valores mejora la interpretabilidad y permite a los agentes actuar apropiadamente incluso en escenarios novedosos. Presentamos ValuePilot, un marco de dos fases que consta de un conjunto de herramientas de generación de conjuntos de datos (DGT) y un módulo de toma de decisiones (DMM). DGT construye escenarios diversos y anotados con valores a partir de un proceso colaborativo entre humanos y LLM. DMM aprende a evaluar acciones basadas en preferencias de valores personales, lo que permite tomar decisiones individualizadas y sensibles al contexto. Cuando se evalúa en escenarios nunca antes vistos, DMM supera las sólidas líneas de base de LLM, incluidas GPT-5, Claude-Sonnet-4, Gemini-2-flash y Llama-3.1-70b, al alinearse con las opciones de acción humana. Nuestros resultados demuestran que la toma de decisiones basada en valores es una vía de ingeniería eficaz y extensible hacia la creación de agentes de IA personalizados e interpretables.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

PaperScout: un agente autónomo para la búsqueda de artículos académicos con optimización de políticas a nivel de secuencia basada en procesos

Diseño de CPU para supercomputación de próxima generación

Asignación de objetivos descentralizada de múltiples agentes para la planificación de rutas utilizando modelos de lenguaje grandes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido