ChiEngMixBench: Evaluación de modelos de lenguaje grandes en generación mixta de código chino-inglés natural y espontáneo

Resumen: La mezcla de códigos es cada vez más frecuente en las interacciones entre humanos y grandes modelos de lenguaje, sin embargo, el trabajo existente a menudo la reduce a un problema de traducción o convertibilidad, lo que dificulta evaluar si el comportamiento de cambio de un modelo es apropiado para el contexto y está alineado con las convenciones humanas. Presentamos ChiEngMixBench, el primer punto de referencia diseñado para evaluar la capacidad de combinación de código en contextos comunitarios auténticos, construido sobre un proceso de construcción general que permite el desarrollo de conjuntos de datos escalables entre dominios y pares bilingües. ChiEngMixBench formula la mezcla de códigos como un problema de alineación cognitiva, caracterizado por dos señales complementarias: espontaneidad y naturalidad. La evaluación empírica muestra que nuestras métricas pueden distinguir sistemáticamente el rendimiento de la combinación de códigos entre modelos. Más allá de la evaluación comparativa, descubrimos una estrategia de estratificación terminológica implícitamente emergente, un fenómeno consistente con la teoría del marco de lenguaje matricial (MLF), que indica una alineación cognitiva estructurada entre los modelos de lenguajes grandes multilingües y la comunicación humana.

Publicado originalmente en export.arxiv.org el 25 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Pedagogía-R1: modelo de razonamiento alineado pedagógicamente con punto de referencia educativo equilibrado

Relevancia, necesidad y utilidad de características: complejidad y algoritmos

La descarga: el objetivo de un agente de IA y la prevención de rayos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido