ChiEngMixBench: Evaluación de modelos de lenguaje grandes en generación mixta de código chino-inglés natural y espontáneo
Resumen: La mezcla de códigos es cada vez más frecuente en las interacciones entre humanos y grandes modelos de lenguaje, sin embargo, el trabajo existente a menudo la reduce a un problema de traducción o convertibilidad, lo que dificulta evaluar si el comportamiento de cambio de un modelo es apropiado para el contexto y está alineado con las convenciones humanas.
Leer más →