基于点云与影像融合的露天矿区建筑图像分割技术

123技术园

首页 / 技术内容

2025-02-11 14:23

No.1338878224943554560

技术概要

PDF全文

本技术涉及计算机领域，提出了一种结合点云与影像数据的露天矿区建筑图像分割技术。该技术首先对矿区激光点云和无人机影像数据进行预处理，随后通过特定算法实现图像分割，旨在提高露天矿区建筑识别的准确性和效率。

背景技术

矿区存在大量的裸露土地、植被、矿坑等复杂背景，这些元素可能会对建筑物的分割产生干扰，且建筑物在影像中可能只占据较小的比例，导致正负样本之间的数据不平衡，这对训练深度学习模型是一个挑战。高精度的点云和影像数据为矿区的建筑物识别提供了丰富的信息来源，但同时也带来了数据量大、处理复杂度高等挑战。传统的建筑物识别方法往往依赖于人工解译，效率低下且易出错。因此，如何有效地利用点云和影像数据，实现矿区建筑物的自动、快速、准确识别，成为了当前的研究热点。在深度学习方法流行之前，基于Texton Forest和Random Forest等传统机器学习分类器的语义分割方法是用得比较多的方法。但是深度学习的兴起，大大的提高了语义分割方法的精度，使得学者对于传统的语义分割方法的研究热情逐渐开始走向下坡路。在2012年，Ciresan采取滑窗的方式，取以每个像素点为中心的小图像块（patch）输入CNN来预测该像素点的语义标签，打破CNN只用于目标分类的先河；伯克利大学的Girshick教授等人共同提出了首个在目标检测方向应用的深度学习模型（Region-basedConvolutional Neural Network，R-CNN）；由于R-CNN的效率太低，2015年由Ross等学者提出了它的改进版本：FastR-CNN，它在传统的R-CNN模型上有所改进的地方是直接使用一个神经网络对整个图像进行特征提取，就省去了串行提取特征的时间。但早期的方法均存在参数量级大、运算繁琐等问题，因此影响了运算速度。针对以上缺陷，Long等在2015年提出一种基于编码器-解码器（上采样/反卷积）结构的语义分割模型，它完全改变了之前需要一个窗口来将语义分割任务转变为图片分类任务的观念，FCN完全丢弃了图片分类任务中全连接层，从头到尾都只使用到了卷积层，但是，若要获得更深入的结构特征，FCN就必须完成多次下采样，同时还必须保存在池化过程中丢弃的位置信息，这可能导致较大的空间信息损失。为了解决这个问题，Ronne berger提出了编码-解码（encoder-decoder，ED）体系结构，该架构利用编码网络来获取图片的高层低分辨率语义特征图，并在解码部分重建图像的细节特征和空间尺寸，从而保证输入和输出之间的分辨率相同。为了提高语义分割的效果，最近卢宏涛等研究提出的Deeplabv3+网络在ED结构的基础上加入了空洞卷积空间金字塔模块（Atrous Spatial Pyramid Pooling，ASPP）像进行分割时，网络对目标区域和特征并没有进行重点关注，使得对重要特征和不重要特征的像素无法准确区分，导致多个类别出现在同一感兴趣区域。近年来，众多学术工作聚焦于高清晰度遥感图像与机载LiDAR数据的融合，以提高建筑物的识别精度。Moussa等、Grigillo等结合LiDAR数据和高分影像采用基于对象的方法，通过设置高度阈值得到建筑物候选区域；Wang等提出一种结合LiDAR数据与高分影像的建筑物提取方法，提取结果的总体精度与用户精度均有所提升。计算机科学的发展，使得深度学习理论及应用取得重要进展，并在图像语义分割中取得良好的效果，特别是对高级语义信息提取，解决了传统图像分割方法中语义信息缺失的问题。Nahhas等在2018年提出了一种基于深度学习（DL）的建筑物检测方法，该方法使用了光检测和测距（LiDAR）数据与正射影像的融合。所提出的方法利用基于对象的分析来创建对象，特征级融合，基于自动编码器的降维将低级特征转换为压缩特征以及卷积神经网络（CNN）将压缩特征转换为高级要素，用于将对象分类为建筑物和背景。针对网格搜索方法对所提出的体系结构进行了优化，并分析和讨论了其对超参数的敏感性；Du等提出了一种结合点和网格特征从LiDAR点云数据中提取建筑物的方法，该方法对大尺寸LiDAR数据也有较好的提取效果；Hujebri等通过正射影像的光谱信息区分植被和建筑物，并用均值漂移方法检测建筑物，该方法在地表复杂的密集城市区显示出良好的性能；Wang等提出U型高分辨率网络（U-HRNet），在多个语义分割和深度预测数据集上实现显著改进，而且计算量几乎没有增加，取得了很好的分类和提取效果。但这些方法均采用标准卷积提取特征，提高了网络模型的复杂度，容易产生特征冗余和过拟合。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

冯媛媛李朝奎李豪任伟郭书朝

技术所属：湖南科技大学

相关技术

一种图像识别方法、装置、设备、介质及计算机程序产品  一种图像识别方法、装置、设备、介质及计算机程序产品 
 本发明涉及图像处理技术领域，具体公开了一种图像识别方法、装置、设备、介质及计算机程序产品，通过采用多分辨率图像样本训练视觉感知模型，并在迭代训练中通过分辨率两两之间的相似度系数计算多分辨率梯度正则项以调整不同分辨率图像特征的梯度数据间的关系，使视觉感知模型理解梯度下降方向差异较大的多种分辨率之间的差异以及理解梯度下降方向差异较小的多种分辨率之间的相似性，利用根据视觉感知损失值和多分辨率梯度正则项计算得到的模型学习损失值更新视觉感知模型的模型参数，解决视觉感知模型学习多种分辨率图像的感知能力时不同分辨率带来的图像特征不同、梯度数据间存在干扰导致模型优化难的问题，提高计算机视觉的分辨率泛化能力。
一种目标识别方法、装置、设备、介质及计算机程序产品  一种目标识别方法、装置、设备、介质及计算机程序产品 
 本发明涉及图像处理技术领域，具体公开了一种目标识别方法、装置、设备、介质及计算机程序产品，通过在视觉感知模型中添加用于对输入的图像特征进行尺寸调整的多分辨率泛化层，在利用多种分辨率图像样本训练视觉感知模型时，利用自监督损失的方式更新多分辨率泛化层的参数后，再将分辨率的图像样本输入视觉感知模型并计算得到感知损失值；利用各分辨率对应的感知损失值更新视觉感知模型的参数，由此进行迭代训练得到训练后的视觉感知模型，降低了不同分辨率图像样本的数据分布差异带来的优化难度，从而提升了视觉感知模型处理不同分辨率的输入图像的分辨率泛化能力，进而提升了目标识别任务适应不同分辨率的输入图像的分辨率泛化能力。
代价地图生成方法、设备、介质、产品及无人驾驶车辆  代价地图生成方法、设备、介质、产品及无人驾驶车辆 
 本发明公开了一种代价地图生成方法、设备、介质、产品及无人驾驶车辆，应用于自动驾驶技术领域。其中，方法包括基于栅格化处理且栅格设置空间体素的待检测行驶区域构建空白三维代价地图。通过对待检测行驶区域的图像数据和点云数据进行目标识别得到第一类障碍物的三维空间数据；基于目标视角下的图像数据和点云数据的融合特征，根据车辆前行过程中不断获取的各帧点云数据对应的栅格新高程信息更新当前时刻的空间体素权重，并基于更新后的空间体素权重确定第二类障碍物的三维形貌信息。将三维空间数据和三维形貌信息填充至空白三维代价地图生成三维代价地图。本发明可以解决相关技术无法精准规避障碍物，提升代价地图的丰富性，提升车辆避障能力。
基于熵权法和装箱算法的Modbus RTU跨TSN调度方法  基于熵权法和装箱算法的Modbus RTU跨TSN调度方法 
 本发明涉及一种基于熵权法和装箱算法的Modbus RTU跨TSN调度方法，属于数据交换网络领域。该方法首先将Modbus RTU数据帧转化为Modbus TCP数据帧，并根据数据类型和端到端时延要求划分数据帧优先级。随后，采用模糊层次分析法和熵权法选取合适的路径进行调度，将端到端时延、带宽和传输周期等因素作为路径选择的依据。最后，利用二维装箱算法进行异构网络的调度计算，生成调度表并指导数据流的传输。本发明有效提高了工业异构网络的数据传输效率和资源利用率，并降低了数据传输的延迟，为工业发展提供了技术支持。
一种基于状态引导以及种子变异的网络协议模糊测试方法和装置  一种基于状态引导以及种子变异的网络协议模糊测试方法和装置 
 一种基于状态引导以及种子变异的网络协议模糊测试方法和装置，其方法包括:1)根据官方RFC协议文档，手动构建高质量基础种子，并将种子与对应状态形成映射；2)将消息序列输入到目标程序进行模糊测试，与目标程序进行交互同时监测程序状态，并获取反馈；3)根据协议状态码以及路径覆盖率反馈，选取覆盖率高的种子进行信息保留变异，保留种子的状态转换功能，以减少无效种子的数量；4)状态引导消息序列生成：根据当前状态以及返回协议状态码，选取目标测试状态，优先选取未到达过或到达次数少的状态作为目标，然后根据基础种子生成能够到达或接近目标状态的消息序列。本发明提出的方法充分利用了协议的状态信息，并在种子变异过程中保留了种子的状态转换能力，通过状态引导以及针对性地消息序列生成，提高了网络协议模糊测试的效率以及质量。
基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法  基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法 
 本申请提供了基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法，涉及图像处理技术领域，包括:按照图像与三维轮廓坐标的映射关系进行拟合，构建三维轮廓的图像分布坐标；通过滤波器组分别对三维轮廓的分布图像进行纹理识别，获得纹理特征及其分布坐标；根据纹理特征进行缺陷区域识别分离，获取缺陷识别区域，按照分布坐标对缺陷识别区域进行缺陷影响性评估，反馈缺陷检测结果。通过本申请可以解决传统缺陷检测方法对于表面纹理的精确提取和分析能力较弱，同时难以在复杂的三维表面上精确定位缺陷，导致缺陷检测结果的精准性、全面性和有效性不足的技术问题，可以达到精准定位缺陷区域，同时对缺陷影响程度进行有效评估的技术效果。
一种细胞图像配准方法及其装置  一种细胞图像配准方法及其装置 
 本发明实施例提供的细胞图像配准方法，包括:对第一明场细胞图像背景和目标亮度取反得到第二明场细胞图像，将第一荧光细胞图像作为第二荧光细胞图像；对第二明场细胞图像和第二荧光细胞图像中目标覆盖的像素数量多的一者进行腐蚀处理，得到第三明场细胞图像和第三荧光细胞图像；根据相位相关法、第三明场细胞图像和第三荧光细胞图像对第一明场细胞图像和第一荧光细胞图像进行配准。本发明实施例首先使得明场细胞图像、荧光细胞图像中背景和目标的相对亮度的方向相同，然后对明场细胞图像和荧光细胞图像中的一者进行腐蚀处理，经过该两步预处理后再采用相位相关法进行配准，明场细胞图像和荧光细胞图像中对应的目标质心对齐，配准更准确、稳定。
一种基于多模态信息融合的图像分类方法  一种基于多模态信息融合的图像分类方法 
 本申请公开了一种基于多模态信息融合的图像分类方法，涉及图像处理技术领域，该图像分类方法利用特征提取网络中的多尺度特征提取模块对每个模态的原始图像进行多尺度特征提取，多特征融合金字塔在FPN框架基础上结合空洞卷积层改进得到，可以有效地提取原始图像的上下文信息，多特征关联模块进一步增强多尺度特征关联，使得特征提取网络能得到原始图像的表征能力更强的单模态特征图，而在对两个单模态特征图进行多模态信息融合得到融合特征图后，除了使用融合特征图，还保留原始的单模态特征图一起利用分类网络进行分类，该方法可以充分挖掘模态内和模态间的图像信息，从而可以有效提升图像分类准确性和鲁棒性。
对象相对自身行进方向确定方法及装置  对象相对自身行进方向确定方法及装置 
 本说明书提供对象相对自身行进方向确定方法及装置，其中对象相对自身行进方向确定方法包括:获取待识别图像；在所述待识别图像中识别目标对象，获得所述目标对象的目标检测框信息和目标检测特征点信息；根据所述目标检测框信息和所述目标检测特征点信息，生成所述目标对象在所述待识别图像中的目标追踪特征点信息；根据所述目标追踪特征点信息，生成所述目标对象的朝向特征向量和位移特征向量；根据所述朝向特征向量和所述位移特征向量，确定所述目标对象相对自身的目标行进方向。实现对目标对象相对自身的目标行进方向的确定，提高确定目标行进方向的准确性。
染色体识别方法及系统  染色体识别方法及系统 
 本发明公开一种染色体识别方法及系统。该方法包括获取染色体数据；根据染色体数据训练扩散概率模型；将染色体图像的染色体掩膜二值图和染色体灰度归一化直方图以及染色体类别嵌入至特征向量中，使用交叉注意力机制将特征向量作用于扩散概率模型，生成染色体扩充数据；根据染色体扩充数据训练染色体识别网络；根据染色体识别网络对需要识别的染色体数据进行识别；本发明基于扩散概率模型的扩增数据方法，既保留了染色体的真实性，又成功转换了染色体的图像特性，有效扩大了数据的多样性。通过该系统，染色体在不同数据源上的识别效果得到了显著的提升，为医疗诊断领域提供了更为精确和可靠的辅助工具。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工