Resumen: En muchos dominios (por ejemplo, IoT, observabilidad, telecomunicaciones, ciberseguridad), está surgiendo una adopción de agentes de análisis de datos conversacionales que permiten a los usuarios “hablar con sus datos” para extraer información.
Leer más →
Resumen:Presentamos method{}, un marco de destilación que evita este cuello de botella entrenando sondas livianas en estados congelados ocultos de los maestros y utilizando las predicciones de la sonda, en lugar de logits de salida, como supervisión para la capacitación de los estudiantes.
Leer más →
Resumen: Los grandes modelos de razonamiento (LRM) han demostrado capacidades de razonamiento notables, sin embargo, a menudo adolecen de pensar demasiado, gastar pasos computacionales redundantes en problemas simples, o pensar poco, no explorando suficientes caminos de razonamiento a pesar de sus capacidades inherentes.
Leer más →