En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->MM-Food-100k: un conjunto de datos de inteligencia de alimentos multimodal de 100,000 muestras con procedencia verificable

MM-Food-100k: un conjunto de datos de inteligencia de alimentos multimodal de 100,000 muestras con procedencia verificable

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Presentamos MM-Food-100k, un conjunto de datos de inteligencia multimodal de alimentos multimodal público de 100,000 muestras con procedencia verificable. Es un subconjunto abierto de aproximadamente el 10% de un corpus original de 1.2 millones de imágenes de alimentos anotadas para una amplia gama de información (como el nombre del plato, la región de la creación). El corpus se recopiló durante seis semanas de más de 87,000 contribuyentes utilizando el modelo de contribución de Codatta, que combina el abastecimiento de la comunidad con controles de calidad asistidos por AI-AI configurables; Cada envío está vinculada a una dirección de billetera en un libro de contabilidad seguro fuera de cadena para la trazabilidad, con un protocolo completo en la cadena en la hoja de ruta. Describimos el esquema, la tubería y el control de calidad, y validamos la utilidad al ajustar grandes modelos en idioma de visión (ChatGPT 5, ChatGPT OSS, Qwen-Max) en la predicción nutricional basada en imágenes. El ajuste fino obtiene ganancias consistentes sobre líneas de base fuera de caja a través de métricas estándar; Reportamos resultados principalmente en el subconjunto MM-Food-100k. Lanzamos MM-Food-100k para acceso público gratuito y conservamos aproximadamente el 90% para el posible acceso comercial con el intercambio de ingresos a los contribuyentes.

Publicado Originalme en export.arxiv.org El 14 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web