Resumen: Las evaluaciones de IA se han convertido en la evidencia principal para implementar sistemas generativos de IA en dominios de alto riesgo. Sin embargo, los paradigmas de evaluación actuales a menudo presentan fallas de validez sistémica.
Leer más →
Resumen: Las alucinaciones de razonamiento en modelos de lenguaje grandes (LLM) a menudo aparecen como conclusiones fluidas pero sin fundamento que violan el contexto dado o el conocimiento fáctico subyacente. Aunque estos fallos se observan ampliamente, los mecanismos por los cuales los transformadores con descodificador los producen siguen siendo poco conocidos.
Leer más →
Resumen:La Teoría de los Seis Pájaros (SBT) trata los objetos macroscópicos como cierres inducidos en lugar de primitivos. Las discusiones empíricas sobre la agencia a menudo combinan la persistencia (ser un objeto) con el control (hacer una diferencia contrafáctica), lo que hace que las afirmaciones de agencia sean difíciles de probar y fáciles de falsificar.
Leer más →