Observatorio de información y Publicaciones | Página 438 de 1331 | Asociación Mexicana del Internet de las Cosas A.C.

Evaluación de modelos de lenguaje grandes en descubrimiento científico

Resumen: Los modelos de lenguaje grande (LLM) se aplican cada vez más a la investigación científica, sin embargo, los puntos de referencia científicos predominantes investigan el conocimiento descontextualizado y pasan por alto el razonamiento iterativo, la generación de hipótesis y la interpretación de las observaciones que impulsan el descubrimiento científico.

Leer más →

Comentarios desactivados

18 diciembre, 2025

Noticias externas

GR-Agent: Agente de razonamiento de gráficos adaptativos con conocimiento incompleto

Resumen: Los modelos de lenguaje grande (LLM) logran resultados sólidos en la respuesta a preguntas de gráficos de conocimiento (KGQA), pero la mayoría de los puntos de referencia asumen gráficos de conocimiento completos (KG) donde existen tripletas de soporte directo.

Leer más →

Comentarios desactivados

18 diciembre, 2025

Lee más sobre el artículo Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Noticias externas

Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Resumen:El conjunto de datos integra 85.000 problemas AoPS seleccionados con 262.000 problemas StackExchange-Math de origen comunitario, combinando tareas de competencia estructuradas con diversas consultas matemáticas del mundo real. Realizamos evaluaciones controladas para evaluar la calidad del conjunto de datos.

Leer más →

Comentarios desactivados

18 diciembre, 2025

Fin del contenido

No hay más páginas por cargar

← Entradas recientes

Entradas antiguas →

Evaluación de modelos de lenguaje grandes en descubrimiento científico

GR-Agent: Agente de razonamiento de gráficos adaptativos con conocimiento incompleto

Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto