Resumen: Los agentes del Large Language Model (LLM) han evolucionado desde la generación de texto básico hasta la realización de tareas complejas de forma autónoma a través de la interacción con herramientas externas.
Leer más →
Resumen:Aumentar el presupuesto de pensamiento de los modelos de IA puede mejorar significativamente la precisión, pero no todas las preguntas justifican la misma cantidad de razonamiento. Es posible que los usuarios prefieran asignar diferentes cantidades de esfuerzo de razonamiento dependiendo de cómo valoran la calidad de la salida frente a la latencia y el costo.
Leer más →
Resumen: Los agentes de IA empresarial deben adaptarse continuamente para mantener la precisión, reducir la latencia y permanecer alineados con las necesidades del usuario. Presentamos una implementación práctica de un volante de datos en NVInfo AI, el asistente de conocimiento de mezcla de expertos (MoE) de NVIDIA que presta servicios a más de 30 000 empleados.
Leer más →