Planqa: un punto de referencia para el razonamiento espacial en LLM utilizando representaciones estructuradas

Resumen: Introducimos a PlanQA, un punto de referencia de diagnóstico para evaluar el razonamiento geométrico y espacial en modelos de gran lenguaje (LLM). Planqa se basa en representaciones estructuradas de escenas interiores, como cocinas, salas de estar y habitaciones, codificadas en un formato simbólico (por ejemplo, JSON, diseños XML).

Leer más →

Comentarios desactivados en Planqa: un punto de referencia para el razonamiento espacial en LLM utilizando representaciones estructuradas

DrugMCTS: un marco de reutilización de drogas que combina búsqueda de árboles de múltiples agentes, trapo y Monte Carlo

Resumen: Los avances recientes en modelos de idiomas grandes han demostrado un potencial considerable en dominios científicos como el descubrimiento de fármacos. Sin embargo, su efectividad sigue siendo limitada cuando el razonamiento se extiende más allá del conocimiento adquirido durante el pretrénmente.

Leer más →

Comentarios desactivados en DrugMCTS: un marco de reutilización de drogas que combina búsqueda de árboles de múltiples agentes, trapo y Monte Carlo

Sistema de planificación y control de código abierto con agentes lingüísticos para el descubrimiento científico autónomo

Resumen: Presentamos un sistema de múltiples agentes para la automatización de tareas de investigación científica, CMBagent. El sistema está formado por aproximadamente 30 agentes del modelo de lenguaje grande (LLM) e implementa una estrategia de planificación y control para orquestar el flujo de trabajo de agente, sin humanos en el bucle en ningún momento.

Leer más →

Comentarios desactivados en Sistema de planificación y control de código abierto con agentes lingüísticos para el descubrimiento científico autónomo

Fin del contenido

No hay más páginas por cargar