本技术聚焦于计算机视觉技术,提出了一种融合多特征的跨模态建筑图像识别技术,涵盖方法、装置、电子设备及存储介质。该技术依托于Mask RCNN架构,实现高效准确的建筑图像提取。
背景技术
随着城市化进程的加速,对于高效、准确的建筑物信息提取需求日益增长。传统的建筑物图像提取方法往往依赖于单一模态数据,如光学图像或合成孔径雷达数据,这在一定程度上限制了提取精度和应用范围。
近年来,深度学习技术的迅速发展为跨模态建筑物图像提取提供了新的可能。在现有技术中,卷积神经网络已成为图像特征提取和分类的主流工具。然而,针对多模态数据的协同处理,尤其是如何有效整合不同传感器获取的数据以提升建筑物检测的准确性和鲁棒性,目前的研究仍存在不足。尽管已有研究者尝试通过特征级融合、决策级融合等策略来增强多模态数据的整合效果,但这些方法往往未能充分利用各模态数据之间的互补信息,或者在处理复杂环境下的建筑物识别问题时性能不佳。
此外,现有技术中对于遥感模糊信息的恢复机制研究不足,尚未形成一套完整的解决方案来应对遥感图像中常见的模糊问题,进一步限制了跨模态建筑物图像提取技术的应用前景。
因此,研究一种新的基于深度学习技术的跨模态建筑物图像提取方法,既可在复杂环境下提高建筑物识别的准确性和鲁棒性,又可满足当前城市化进程中对于高效、准确建筑物信息提取的迫切需求。
实现思路