高光谱图像分类的GAT-CNN特征融合技术
2025-02-12 14:15
No.1339238472816533504
技术概要
PDF全文
本技术介绍了一种融合图注意力网络(GAT)与卷积神经网络(CNN)的高光谱图像分类方法。该方法首先将高光谱数据集分为训练集、测试集和验证集,接着构建一个包含CNN和GAT的双分支特征提取架构,以实现特征的加权融合,提高分类精度。
背景技术
高光谱图像在可见光和红外波段内具有数百甚至数千个连续波段,能够捕捉物体和地表材质在不同波段的特征光谱信息。相比传统的彩色或单波段图像只能提供有限的颜色或波段信息,高光谱图像能够提供更为丰富和详细的地物光谱特征,使得对地物进行更精确的分析和识别成为可能。因此,高光谱图像已广泛应用于农业作物监测、环境污染检测、城市规划、矿产勘探、气象预测和军事侦察等领域。高光谱图像凭借其丰富的光谱信息和多样化的应用能力,成为现代遥感技术中不可或缺的重要组成部分。这些应用的前提是精确地对高光谱图像(HSI)中的每个像素进行分类。 在过去的几十年里,各种基于机器学习的分类器已经被开发出来用于高光谱图像分类。早期的分类方法通常是以高纬度的高光谱信息映射到低纬度上,并对低纬度数据进行处理。因此,如何建立映射函数和寻找可分离超平面成为研究的目标。例如,逻辑回归和极限学习机已被用于开发像素级HSI分类器。然而,像素化方法通常会在最终的分类图中产生相当大的误差或异常值,为了缓解这一问题,利用核支持向量机和多核学习等核技巧来提高线性可分性。但这些方法通常侧重于分类器的设计,而忽略了特征的表示和学习。为了充分利用光谱信息,已经开发了基于表示的典型方法,如稀疏表示、低阶表示、和协作表示。通过表征学习,可以揭示光谱的内在数据结构,减少对标记样本的依赖。此外,还探索了HSI的空间结构,如图构建、超像素分割、形态分割等,以促进光谱-空间特征学习。通过对HSI的空间结构进行显式建模,可以更好地利用其空间信息。然而,受人工特征和经验参数的限制,上述方法不能从HSI中学习稳健的深层特征表示。 相比于传统机器学习分类方法,深度学习方法可以从训练数据中自动学习自适应和稳健的深度特征。目前,许多经典的深度学习方法已经被应用到HSI分类中,并取得了良好的效果。如从一维卷积神经网络(CNN)到3D CNN的变体,从单一CNN到混合CNN,深度学习方法在HSI图像分类中的优势在于能够更好地利用大数据和强大的计算能力,从而提高分类精度、减少人工特征工程的需求,并且能够处理更复杂和高维度的数据特征。由于计算复杂度较高,这种混合CNN需要较高的计算力和较长的训练时间。以往的深度学习模型都是针对欧几里得数据而设计的,它们往往忽略了相邻土地覆盖之间的内在相关性。近年来,由于能够对任意结构的图进行卷积运算,图神经网络(GNN)受到越来越多的关注,通过将HSI编码成图,可以显式地利用相邻土地覆盖之间的相关性,并且GNN可以更好地模拟HSI的空间上下文结构。GNN即可以对非欧氏数据进行描述学习,也可以同时对节点特征信息和结构信息进行端到端的表示学习。HSI数据可以通过基于超像素的方法转换为图形数据,然后使用GNN方法可以有效地对光谱-空间上下文信息进行建模,通过这种方式,隐式扩展了标签的数量,在一定程度上缓解了小样本的问题。基于超像素的GNN可以在图形上模拟土地覆盖的各种空间结构,但它不能为每个像素生成细微的单独特征。相比之下,CNN可以在像素水平上学习局部光谱-空间特征,但其接受范围通常限于一个小正方形窗口,因此,HSI的大尺度上下文结构可能很难捕捉到。如何将基于超像素级的GNN和基于像素级CNN优点相互融合,数据互通逐渐成为HSI分类领域的重点问题。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王文卿  杨毅飞  穆琨鹏  何霁  李凌舟  贾飞  刘涵
技术所属: 西安理工大学
相关技术
基于计算机视觉的矿下钻机钻杆计数方法 基于计算机视觉的矿下钻机钻杆计数方法
基于人工智能的视频检测方法 基于人工智能的视频检测方法
一种高压输电网的闪放电监测方法 一种高压输电网的闪放电监测方法
虚拟模型的摆放方法及装置 虚拟模型的摆放方法及装置
医学图像的分割方法和计算机可读存储介质 医学图像的分割方法和计算机可读存储介质
图像生成方法及装置、电子设备和存储介质 图像生成方法及装置、电子设备和存储介质
一种基于OpenGL ES架构的图片处理方法 一种基于OpenGL ES架构的图片处理方法
一种电单车及其侦测旁车摆放姿势的方法、存储介质 一种电单车及其侦测旁车摆放姿势的方法、存储介质
一种喷金质量检测方法及装置 一种喷金质量检测方法及装置
基于文本-区域匹配的带有缺失标签场景下的多标签图像识别方法 基于文本-区域匹配的带有缺失标签场景下的多标签图像识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利