En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Crypticbio: un gran conjunto de datos multimodal para la biodiversidad visualmente confusa

Crypticbio: un gran conjunto de datos multimodal para la biodiversidad visualmente confusa

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Presentamos CrypticBio, el conjunto de datos multimodal más grande disponible de especies visualmente confusas, específicamente seleccionados para apoyar el desarrollo de modelos de IA en el contexto de las aplicaciones de biodiversidad. Las especies visualmente confusas o crípticas son grupos de dos o más taxones que son casi indistinguibles en función de las características visuales solas. Si bien mucho trabajo existente aborda la identificación taxonómica en un sentido amplio, los conjuntos de datos que abordan directamente la confusión morfológica de las especies crípticas son pequeñas, seleccionadas manualmente y se dirigen solo a un taxón. Por lo tanto, el desafío de identificar tales diferencias sutiles en una amplia gama de taxones sigue sin abordar. Comisariada de las tendencias del mundo real en la identificación errónea de las especies entre anotadores comunitarios de inaturalista, Crypticbio contiene 52k grupos crípticos únicos que abarcan 67k especies, representados en 166 millones de imágenes. Annotaciones de imágenes de grado de investigación ricas, incluidas la terminología de especies científicas, multiculturales y multilingües, la taxonomía jerárquica, el contexto espacio-temporal y los grupos crípticos asociados, la IA multimodal en la investigación de la biodiversidad. Para una fácil curación del conjunto de datos, proporcionamos una tubería de código abierto Crypticbio-Curation. La naturaleza multimodal del conjunto de datos más allá del idioma de la visión surge de la integración de datos geográficos y temporales como señales complementarias para identificar especies crípticas. Para resaltar la importancia del conjunto de datos, comparamos con un conjunto de modelos de base de última generación en subconjuntos crípticos de especies comunes, invisibles, en peligro e invasivas, y demostramos el impacto sustancial del contexto geográfico en el aprendizaje de disparo cero en idioma visión para especies crípticas. Al introducir Crypticbio, nuestro objetivo es catalizar el progreso hacia los modelos de IA de biodiversidad listos para el mundo real capaces de manejar los desafíos matizados de la ambigüedad de las especies.

Publicado Originalme en rss.arxiv.org El 21 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web