 Resumen: Los datos de registro de eventos, que registran acciones detalladas del usuario y eventos del sistema, representan uno de los activos más valiosos para los servicios digitales modernos. Sin embargo, la complejidad y heterogeneidad de los registros de eventos industriales, caracterizados por su gran escala, alta dimensionalidad, diversos tipos de datos y estructuras temporales o relacionales intrincadas, hacen que la ingeniería de características sea extremadamente desafiante. Los enfoques existentes de ingeniería automática de características, como AutoML o métodos genéticos, a menudo adolecen de una explicabilidad limitada, operaciones predefinidas rígidas y poca adaptabilidad a datos heterogéneos complicados. En este artículo, proponemos FELA (Feature Engineering LLM Agents), un sistema evolutivo de múltiples agentes que extrae de forma autónoma características significativas y de alto rendimiento de datos complejos de registros de eventos industriales. FELA integra las capacidades de razonamiento y codificación de grandes modelos de lenguaje (LLM) con un paradigma de autoevolución guiado por conocimientos. Específicamente, FELA emplea agentes especializados (agentes de ideas, agentes de código y agentes críticos) para generar, validar e implementar de manera colaborativa ideas novedosas. Un agente de evaluación resume los comentarios y actualiza una base de conocimientos jerárquica y un sistema de memoria dual para permitir la mejora continua. Además, FELA introduce un algoritmo de evolución agente, que combina el aprendizaje por refuerzo y los principios del algoritmo genético para equilibrar la exploración y la explotación en todo el espacio de ideas. Amplios experimentos en conjuntos de datos industriales reales demuestran que FELA puede generar características explicables y relevantes para el dominio que mejoran significativamente el rendimiento del modelo y al mismo tiempo reducen el esfuerzo manual. Nuestros resultados resaltan el potencial de los sistemas multiagente basados en LLM como marco general para la ingeniería de funciones automatizada, interpretable y adaptable en entornos complejos del mundo real.
Resumen: Los datos de registro de eventos, que registran acciones detalladas del usuario y eventos del sistema, representan uno de los activos más valiosos para los servicios digitales modernos. Sin embargo, la complejidad y heterogeneidad de los registros de eventos industriales, caracterizados por su gran escala, alta dimensionalidad, diversos tipos de datos y estructuras temporales o relacionales intrincadas, hacen que la ingeniería de características sea extremadamente desafiante. Los enfoques existentes de ingeniería automática de características, como AutoML o métodos genéticos, a menudo adolecen de una explicabilidad limitada, operaciones predefinidas rígidas y poca adaptabilidad a datos heterogéneos complicados. En este artículo, proponemos FELA (Feature Engineering LLM Agents), un sistema evolutivo de múltiples agentes que extrae de forma autónoma características significativas y de alto rendimiento de datos complejos de registros de eventos industriales. FELA integra las capacidades de razonamiento y codificación de grandes modelos de lenguaje (LLM) con un paradigma de autoevolución guiado por conocimientos. Específicamente, FELA emplea agentes especializados (agentes de ideas, agentes de código y agentes críticos) para generar, validar e implementar de manera colaborativa ideas novedosas. Un agente de evaluación resume los comentarios y actualiza una base de conocimientos jerárquica y un sistema de memoria dual para permitir la mejora continua. Además, FELA introduce un algoritmo de evolución agente, que combina el aprendizaje por refuerzo y los principios del algoritmo genético para equilibrar la exploración y la explotación en todo el espacio de ideas. Amplios experimentos en conjuntos de datos industriales reales demuestran que FELA puede generar características explicables y relevantes para el dominio que mejoran significativamente el rendimiento del modelo y al mismo tiempo reducen el esfuerzo manual. Nuestros resultados resaltan el potencial de los sistemas multiagente basados en LLM como marco general para la ingeniería de funciones automatizada, interpretable y adaptable en entornos complejos del mundo real.
Publicado originalmente en export.arxiv.org el 29 de octubre de 2025.
Ver fuente original

 
 
			 
							 
							 
							