Resumen: El diseño de ICS analógicos requiere hacer complejas complejas, al tiempo que aborda la física del dispositivo y la variabilidad de los circuitos. Esto hace que la automatización completa con soluciones basadas en el aprendizaje sea difícil de lograr. Sin embargo, el aprendizaje de refuerzo (RL) ha alcanzado recientemente resultados significativos, particularmente en la resolución del problema de planificación del piso. Este artículo presenta un método híbrido que combina RL con una estrategia de haz (BS). El algoritmo BS mejora el proceso de inferencia del agente, lo que permite la generación de planos de piso flexibles al acomodar diversas ponderaciones objetivas y abordar la congestión sin la necesidad de reentrenamiento de políticas o ajuste fino. Además, la capacidad de generalización del agente RL permanece intacta, junto con su manejo eficiente de las características y limitaciones del circuito. Los resultados experimentales muestran aprox. Mejora del 5-85% en el área, el espacio muerto y la longitud del alambre de medio perímetro en comparación con una aplicación RL estándar, junto con mayores recompensas para el agente. Además, el rendimiento y la eficiencia se alinean estrechamente con los de las técnicas de vanguardia existentes.
Publicado Originalme en rss.arxiv.org El 8 de mayo de 2025.
Ver Fuente Original