数字农科院2.0

细粒度图像分类上Vision Transformer的发展综述

文献类型: 中文期刊

作者: 孙露露;刘建平;王健;邢嘉璐;张越;王晨阳

作者机构:

关键词: 细粒度图像分类;Vision Transformer;特征提取;特征关系构建;特征注意;特征增强

期刊名称:计算机工程与应用

ISSN: 1002-8331

年卷期: 2024 年

页码:

收录情况: 北大核心(2020版) ; ; CSCD(2023-2024年度) ; ; 科技核心(2023版)

摘要: 细粒度图像分类(Fine-grained image classification,FGIC)一直是计算机视觉领域中的重要问题之一。与传统图像分类任务相比,FGIC的挑战在于类间对象之间极其相似,使任务难度进一步增加。随着深度学习的发展,Vision Transformer(ViT)模型在视觉领域掀起热潮,并被引入到FGIC任务中。介绍了FGIC任务所面临的挑战、ViT模型相关介绍及特性分析。主要根据模型结构全面综述了基于ViT的FGIC算法,包括特征提取、特征关系构建、特征注意和特征增强四方面内容,对每种算法进行总结,并分析它们的优缺点。接着,通过对不同ViT模型在相同公用数据集上进行模型性能比较,以验证它们在FGIC任务上的有效性。最后,指出了目前研究的不足,并提出未来研究方向,以进一步探索ViT在FGIC中的潜力。

分类号:

  • 相关文献

[1]Rice leaf disease identification by residual-distilled transformer. Changjian Zhou,Yujie Zhong,Sihan Zhou,Jia Song,Wensheng Xiang. 2023

[2]Non-Contact Measurement of Pregnant Sows' Backfat Thickness Based on a Hybrid CNN-ViT Model. Li, Xuan,Yu, Mengyuan,Xu, Dihong,Zhao, Shuhong,Tan, Hequn,Liu, Xiaolei. 2023

[3]基于改进C-V模型的棉花叶片目标提取方法. 李凯,张建华,韩书庆,孔繁涛,吴建寨. 2019

[4]基于模板匹配的多目标水稻灯诱害虫识别方法的研究. 吕军,姚青,刘庆杰,薛杰,陈宏明,杨保军,唐健. 2012

[5]基于图像的昆虫自动识别与计数研究进展. 姚青,吕军,杨保军,薛杰,郑宏海,唐健. 2011

[6]基于Gabor能量特征的牧草识别. 潘新,刘桂香,闫伟红,李莹,李燕华,侯振杰. 2012

[7]基于多层感知神经网络的水稻叶瘟病识别方法. 刘立波,周国民. 2009

[8]基于分形维数的放牧地秃斑特征提取方法及其应用. 王钊齐,林慧龙. 2011

[9]基于深度图像和BP神经网络的肉鸡体质量估测模型. 王琳,孙传恒,李文勇,吉增涛,张翔,王以忠,雷鹏,杨信廷. 2017

[10]基于Gabor能量特征的牧草识别. 潘新,刘桂香,闫伟红,李莹,李燕华,侯振杰. 2013

[11]基于支持向量机的水稻纹枯病识别研究. 刘婷婷. 2011

[12]家蚕微粒子病的图像识别技术研究. 张香琴,方如明,汪萍,蔡健荣,许俐. 2001

[13]基于计算机视觉技术的番茄叶部病害识别. 柴阿丽,李宝聚,石延霞,岑喆鑫,黄海洋,刘君. 2010

[14]基于图像处理技术的蚕蛹性别识别应用研究. 孙辉,梁培生,张国政,方瑷. 2015

[15]基于Fisher判别分析的玉米叶部病害图像识别. 王娜,王克如,谢瑞芝,赖军臣,明博,李少昆. 2009

[16]基于GIS和KPCA的农业空间数据特征提取研究. 孙荣荣,姜国金. 2010

[17]贝叶斯方法在玉米叶部病害图像识别中的应用. 赵玉霞,王克如,白中英,李少昆,谢瑞芝,高世菊. 2007

[18]基于近红外傅里叶特征提取方法的土壤含水率检测. 李小昱,肖武,李培武,雷廷武,王为,冯耀泽. 2009

[19]基于众包数据和遗传规划算法的农作物遥感智能识别方法. 赵立成,刘园,温彩运,张士博,吴清滢,梁社芳,张素心,王淇锋,游振宇,史云,吴文斌,王聪,段玉林,宋茜,陆苗,余强毅. 2022

[20]高光谱成像的甜瓜嫁接愈合状态早期分类检测. 杨杰锴,郭志强,黄远,高宏盛,金科,吴香帅,杨杰. 2022

作者其他论文 更多>>