En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Mirror: monólogo interno cognitivo entre giros conversacionales para una reflexión persistente y razonamiento en LLM conversacionales

Mirror: monólogo interno cognitivo entre giros conversacionales para una reflexión persistente y razonamiento en LLM conversacionales

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La inteligencia humana se basa en el monólogo interno para procesar información compleja a través de la reflexión simultánea, la recuperación de la memoria y la formulación de respuesta. Introducimos a Mirror (razonamiento interno modular, reflexión, orquestación y respuesta), una arquitectura cognitiva que implementa sistemáticamente estas capacidades de razonamiento paralelo en modelos de idiomas grandes. Mirror opera como un sistema unificado con dos capas funcionales distintas: el pensador y el hablador. El pensador abarca: (1) el gerente de monólogo interno, coordinando los hilos de razonamiento en las dimensiones cognitivas (objetivos, razonamiento y memoria); y (2) el controlador cognitivo, sintetizando estos hilos en una narrativa interna coherente mantenida en los giros de conversación. El componente de Talker luego aprovecha esta narrativa integrada para las respuestas conscientes del contexto. Evaluado en el punto de referencia Curate: probando el diálogo personalizado con restricciones críticas de seguridad, preferencias conflictivas y consistencia múltiple, LLM utilizando la arquitectura del espejo alcanza hasta un 156% de mejora relativa en escenarios de seguridad críticos que involucran a tres personas con preferencias conflictivas, manteniendo una precisión promedio de ~> 80% en todos los escenarios. En las comparaciones específicas de escenarios, GPT-4O, Gemini 1.5 Pro, Claude 3.7 Sonnet, Variantes de LLAMA 4 y variantes Mistral 3 con la arquitectura de espejo superaron los modelos de referencia superiores a un 21% en promedio (15.5 puntos porcentuales absolutos). Mirror aborda directamente tres modos críticos de falla de LLM: sycofancia, déficit atencional a información crítica y priorización inconsistente de restricciones conflictivas. Este trabajo une la ciencia cognitiva y la IA al implementar un razonamiento interno modular inspirado en la cognición humana, creando un modelo interno persistente que mejora significativamente las capacidades de conversación múltiple.

Publicado Originalme en rss.arxiv.org El 2 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web