Resumen:La toma de decisiones personalizada es esencial para la interacción entre humanos y IA, lo que permite a los agentes de IA actuar en alineación con las preferencias de valor de los usuarios individuales. A medida que los sistemas de IA se expanden hacia aplicaciones del mundo real, adaptarse a valores personalizados más allá de la finalización de tareas o la alineación colectiva se ha convertido en un desafío crítico. Abordamos esto proponiendo un enfoque basado en valores para la toma de decisiones personalizada. Los valores humanos sirven como señales estables y transferibles que respaldan un comportamiento consistente y generalizable en todos los contextos. En comparación con los paradigmas orientados a tareas impulsados por recompensas e incentivos externos, la toma de decisiones basada en valores mejora la interpretabilidad y permite a los agentes actuar apropiadamente incluso en escenarios novedosos. Presentamos ValuePilot, un marco de dos fases que consta de un conjunto de herramientas de generación de conjuntos de datos (DGT) y un módulo de toma de decisiones (DMM). DGT construye escenarios diversos y anotados con valores a partir de un proceso colaborativo entre humanos y LLM. DMM aprende a evaluar acciones basadas en preferencias de valores personales, lo que permite tomar decisiones individualizadas y sensibles al contexto. Cuando se evalúa en escenarios nunca antes vistos, DMM supera las sólidas líneas de base de LLM, incluidas GPT-5, Claude-Sonnet-4, Gemini-2-flash y Llama-3.1-70b, al alinearse con las opciones de acción humana. Nuestros resultados demuestran que la toma de decisiones basada en valores es una vía de ingeniería eficaz y extensible hacia la creación de agentes de IA personalizados e interpretables.
Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original
