En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Desde feromonas hasta políticas: aprendizaje de refuerzo para enjambres biológicos de ingeniería

Desde feromonas hasta políticas: aprendizaje de refuerzo para enjambres biológicos de ingeniería

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La inteligencia del enjambre surge de las interacciones descentralizadas entre agentes simples, lo que permite la resolución de problemas colectivos. Este estudio establece una equivalencia teórica entre la agregación mediada por feromonas en celeg y el aprendizaje de refuerzo (RL), lo que demuestra cómo las señales estigméricas funcionan como mecanismos de recompensa distribuidos. Modelamos enjambres de nematodos diseñados que realizan tareas de alimentación, que muestran que la dinámica de la feromona refleja las actualizaciones de aprendizaje cruzado matemáticamente, un algoritmo RL fundamental. La validación experimental con datos de la literatura confirma que nuestro modelo replica con precisión los patrones empíricos celeg de alimentación en condiciones estáticas. En entornos dinámicos, los senderos de feromonas persistentes crean bucles de retroalimentación positivos que obstaculizan la adaptación al bloquear los enjambres en opciones obsoletas. A través de experimentos computacionales en escenarios de bandidos múltiples, revelamos que la introducción de una minoría de agentes exploratorios insensibles a las feromonas restaura la plasticidad colectiva, lo que permite un cambio rápido de tareas. Esta heterogeneidad conductual equilibra las compensaciones de exploración-explotación, implementando la extinción a nivel de enjambre de estrategias obsoletas. Nuestros resultados demuestran que los sistemas estigméricos codifican inherentemente procesos RL distribuidos, donde las señales ambientales actúan como memoria externa para la asignación de crédito colectivo. Al unir la biología sintética con robótica de enjambre, este trabajo avanza en los sistemas de vida programables capaces de tomar decisiones resistentes en entornos volátiles.

Publicado Originalme en export.arxiv.org El 24 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web