基于大模型的图像自动化标注方法研究

胡昱然

重庆大学

摘要：随着深度学习的发展,针对海量数据实现高效率和高质量标注成为研究重点。目前基于大模型的自动化数据标注方法被逐渐提出,这是因为大模型强大的泛化能力支持通过微调的方式快速定制适用于全新数据集的自动化标注模型。其中,基于视觉大模型SAM的自动化图像分割标注方法取得了巨大成功。这种自动化标注是提示型的,用户给定点、框的视觉提示或文本提示,模型将这些提示完成编码后与图像特征向量一起送入到解码端完成标注。然而,基于视觉提示SAM的自动化标注方法存在交互效率低、编码信息不足等问题。此外,基于文本提示SAM的自动化标注方法存在模型复杂度高,推理时间长等问题。为解决上述挑战,本文聚焦于计算机视觉领域的图像分割标注任务,针对SAM现有的基于点和框的视觉提示交互效率低、编码信息不足等问题,提出了一种基于涂鸦提示编码的交互式自动化标注方法,有效提升了分割标注输出掩膜的质量。针对基于文本提示SAM的一类自动化标注方法中引入两种大模型导致复杂度较高、推理时间长的问题,分别为该方法中的两种大模型设计了基于知识蒸馏的轻量化算法,能够以较小的精度下降为代价大幅降低模型复杂度,本文的主要贡献为: (1)提出了以一种基于涂鸦...更多

关键词：

自动化分割标注;视觉分割大模型;涂鸦交互式标注;知识蒸馏;

专辑：
信息科技
专题：
计算机软件及计算机应用
DOI：
10.27670/d.cnki.gcqdu.2024.002583
分类号：
TP391.41

导师：

周喜川

学科专业：

电子信息（专业学位）

硕士电子期刊出版信息：

年期：2025年第12期网络出版时间：2025-11-16—2025-12-15

地址 https://kns.cnki.net/kcms2/article/abstract?v=SQKXI91EiTp7xQAGjR3RcjW9KR3lJfJnDaks8RAZdHSYugDK28VSmfcMjuLSWYCOVoOEciv1aNANiOSv7hri-3No1S2uEQ92iLfDAPoM7QSNAK-lMOQ2EGGNub5cTVR7PLl1KQzsClNzX_MJgp97qguQyQ87s0uqCDhSxWorX8QpNcR8ANbWv7-vDVduzEKm&uniplatform=NZKPT&language=CHS

如果觉得文章对你有用，请随意赞赏