Resumen: Este trabajo presenta un enfoque que utiliza inteligencia artificial generativa para escribir automáticamente programas de clasificadores químicos para clases en las entidades químicas de la base de datos de interés biológico (CHEBI). Estos programas pueden usarse para una clasificación de tiempo de ejecución determinista eficiente de estructuras de sonrisas, con explicaciones del lenguaje natural. Los programas mismos constituyen un modelo ontológico computable explicable de nomenclatura de la clase química, que llamamos el programa Chebi Chemical Class Ontology (C3PO).
Validamos nuestro enfoque contra la base de datos Chebi y comparamos nuestros resultados con los modelos de aprendizaje profundo de última generación. También demostramos el uso de C3PO para clasificar los ejemplos fuera de distribución tomados de repositorios de metabolómica y bases de datos de productos naturales. También demostramos el uso potencial de nuestro enfoque para encontrar errores de clasificación sistemática en las bases de datos químicas existentes, y mostramos cómo se puede utilizar un enfoque de inteligencia artificial en conjunto que combina ontologías generadas, búsqueda de literatura automatizada y modelos de visión multimodal para identificar posibles errores que requieren validación de expertos de expertos.
Publicado Originalme en rss.arxiv.org El 26 de mayo de 2025.
Ver Fuente Original