Resumen:Aumentar el presupuesto de pensamiento de los modelos de IA puede mejorar significativamente la precisión, pero no todas las preguntas justifican la misma cantidad de razonamiento. Es posible que los usuarios prefieran asignar diferentes cantidades de esfuerzo de razonamiento dependiendo de cómo valoran la calidad de la salida frente a la latencia y el costo.
Leer más →
Resumen: Los agentes de IA empresarial deben adaptarse continuamente para mantener la precisión, reducir la latencia y permanecer alineados con las necesidades del usuario. Presentamos una implementación práctica de un volante de datos en NVInfo AI, el asistente de conocimiento de mezcla de expertos (MoE) de NVIDIA que presta servicios a más de 30 000 empleados.
Leer más →
Resumen: Los grandes modelos de razonamiento (LRM) han demostrado capacidades impresionantes, pero adolecen de ineficiencias cognitivas como “pensar demasiado” en problemas simples y “pensar insuficientemente” en problemas complejos.
Leer más →