基于高斯泼溅与深度学习的三维场景重着色优化方法

123技术园

首页 / 技术内容

2025-02-24 14:20

No.1343588457146228736

技术概要

PDF全文

本技术公开了基于高斯泼溅与深度学习的三维场景重着色优化方法，包括如下步骤:S1、构建给定场景的多视角数据集，生成初始点云；S2、基于所述初始点云，从所有输入像素中提取具有代表性的颜色集合，生成调色板并作为初始设置；S3、利用所述调色板和高斯泼溅算法渲染多视角结果图片，计算损失函数，通过反向传播优化参数，生成优化后的高斯辐射场；S4、基于优化后的高斯辐射场和用户修改的调色板颜色，重新渲染场景并生成重着色结果。本发明结合高斯泼溅算法与深度学习技术，实现三维场景高效重着色优化，具备编辑直观、光照表达精准及渲染真实的优点。

背景技术

在计算机图形学和计算机视觉领域，三维内容的编辑是当前研究中的一个重要方向。随着技术的不断进步，人们对三维场景的外观编辑需求日益增长，如何以一种既高效又精确的方式实现场景外观的编辑成为一个重要的研究课题。在传统的三维场景编辑中，通常通过直接操作几何模型、材质参数和光照模型来调整场景的外观。然而，这些方法不仅操作复杂，而且难以适应现代三维内容快速生成和多样化的需求。因此，探索更加自动化、智能化的三维场景编辑方法成为计算机图形学领域的重要研究方向。近年来，基于辐射场的三维场景表示方法在相关研究中产生了深远的影响。这类方法通过从多视角图像中重建复杂的三维场景，能够实现具有照片级真实感的新视角合成。其中，神经辐射场（NeRF）及其变体是一种具有代表性的技术，其通过多层感知机（MLP）对场景的几何结构和外观进行编码，为场景生成和渲染提供了强大的表达能力。然而，NeRF在场景外观编辑方面仍面临许多挑战。由于NeRF的场景外观信息编码在多层感知机网络中，外观参数难以直接解码和调整，这使得对场景的局部编辑变得十分复杂且不直观。此外，NeRF对高频光照信息的表达能力较弱，这进一步限制了其在高精度编辑场景中的应用。相较于NeRF，显式的基于点的辐射场方法提供了一种更具直观性的场景表示方式。其中，3D高斯泼溅算法（3D-GS）通过使用显式的高斯核对场景进行建模，为场景外观的局部编辑提供了可能性。然而，3D-GS仍然面临许多技术难点。首先，3D-GS缺乏精确识别目标高斯核的方法，这导致对特定区域的局部编辑难以实现。其次，3D-GS使用球谐函数（SH）为每个高斯核建模各向异性的颜色，虽然这种方法在理论上能够支持高频光照信息的表达，但在实际操作中，其对高频光照细节的捕捉能力有限。此外，球谐函数的参数调整较为复杂，在实际应用中不够直观，限制了其用户可操作性。针对上述问题，学术界和工业界提出了多种改进方法，以提升三维场景的外观编辑能力。目前，这些方法主要可以分为两大类：基于3D风格迁移的方法和基于文本驱动编辑的方法。基于3D风格迁移的方法通过从参考风格中提取纹理或光照特征，尝试将这些特征迁移到目标场景中。这种方法在实现整体风格化效果上具有较好的表现，但在实现细粒度控制时显得力不从心。而基于文本驱动编辑的方法试图通过自然语言描述来引导场景编辑，例如利用预训练的文生图扩散模型生成或修改场景的特定区域。这种方法虽然在交互方式上具有一定的创新性，但由于其依赖于大型预训练模型，往往需要大量的GPU内存，这大大增加了实现成本。此外，文本驱动编辑在实现精确控制方面仍然存在困难，例如将场景中的某一对象颜色调整为特定的RGB值，这种需求在实际操作中难以通过纯文本描述实现。针对上述现有方法的不足，基于调色板的重新着色方法在编辑粒度和易用性之间取得了一定的平衡。通过引入调色板这一中间表示，可以更直观地对场景中的颜色进行调整。然而，现有的调色板方法在实际应用中仍面临“颜色污染”问题，即某个调色板颜色在辐射场中分布过于广泛，当用户对该颜色进行修改时，渲染结果中会出现大范围的颜色变化，这远超用户的预期。此外，现有方法在生成调色板和优化渲染质量方面也存在不足，例如缺乏对调色板颜色精细控制的机制，难以兼顾细粒度编辑和全局效果。因此，如何提供基于高斯泼溅与深度学习的三维场景重着色优化方法是本领域技术人员亟需解决的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

黄章进毕浩宇吴建辉

技术所属：中国科学技术大学

相关技术

一种基于点云信息的螺柱检测方法 一种基于点云信息的螺柱检测方法
本发明提供一种基于点云信息的螺柱检测方法，利用三维视觉传感器获取底面及螺柱侧表面点云，对螺柱侧表面点云进行预处理，剔除杂点，获取处理后的点云中各点的法向量；利用法向量计算余弦相似度，剔除非内外径上的螺纹点；利用所有内螺纹点、外螺纹点拟合圆柱，获取螺柱中轴线；计算中轴线与底面的夹角及交点坐标，作为螺柱位姿信息，本发明方法直接利用内螺纹点和外螺纹点拟合中轴线，计算准确、耗时短，此外，通过对点云的预处理，将点云中的噪声、杂点剔除，进一步保障了拟合结果的有效性，具有自动化程度高、抗干扰性强的特点。
基于深度学习网络的多IMU动作捕捉方法、系统及介质 基于深度学习网络的多IMU动作捕捉方法、系统及介质
本发明涉及人机交互装置技术领域，具体涉及一种基于深度学习网络的多IMU动作捕捉方法、系统及介质。本发明包括如下步骤:S1、多IMU动作的捕捉：预先在SMPL人体模型的关键部位佩戴多个IMU；通过Mujoco物理引擎对多变量特征施加高斯白噪声来模拟真实的IMU数据；S2、构建深度学习网络：深度学习网络输入多变量特征，通过正向TCN和反向TCN学习得到空间特征，再将空间特征融合，经过正向GRU和反向GRU得到时序特征，时序特征融合输入多头注意力层以得到人体姿态参数；S3、人体姿态的物理约束：利用PBDL损失函数，施加物理约束后的深度学习网络，实现对人体姿态的准确识别，符合自然世界的物理规律。
一种加工轨迹形变补偿方法及系统 一种加工轨迹形变补偿方法及系统
本发明提出一种加工轨迹形变补偿方法及系统，其中，加工轨迹形变补偿方法包括以下步骤:获得初始轨迹；获取图像；对获取的图像进行拼接及标定等预处理操作；设置多个锚定点测量盒，在对应范围内计算获得锚定点；在初始轨迹点位处进行轨迹点测量盒的生成，并设置好各轨迹点测量盒对应的轨迹点坐标计算方式；获得锚定点；根据所得锚定点坐标更新相应的被锚定的轨迹点测量盒的位置；在轨迹点测量盒的范围内按设定的方式计算坐标并更新至对应轨迹点，获得矫正轨迹；直接执行矫正轨迹；通过加工轨迹形变补偿系统的初始轨迹获取单元、图像获取单元、视觉处理单元、轨迹执行单元去完成以上步骤，便能够以较为简易的方式实现大型复杂轨迹的纠偏或定位。
基于遥感技术的森林积蓄量监测分析方法及系统 基于遥感技术的森林积蓄量监测分析方法及系统
本申请提供了一种基于遥感技术的森林积蓄量监测分析方法及系统。该基于遥感技术的森林积蓄量监测分析方法包括:通过无人机采集森林图像；对所述森林图像进行融合，生成融合图像；对所述融合图像进行增强，生成增强图像，提取所述增强图像中的森林特征和空间特征；根据所述森林特征和所述空间特征，确定该森林片区对应的积蓄参数；根据所述积蓄参数和历史积蓄参数进行对比，生成监测分析报告。该过程利用无人机高效采集森林图像，通过图像融合和增强技术提取关键森林特征和空间特征，以准确计算该区域的积蓄参数，并与历史数据进行对比，生成详尽的监测分析报告。提高了森林资源管理的准确性和实时性，为生态保护和可持续发展提供了科学依据。
油罐布局信息生成方法、装置、电子设备、介质 油罐布局信息生成方法、装置、电子设备、介质
本公开的实施例公开了油罐布局信息生成方法、装置、电子设备和介质。该方法的一具体实施方式包括:对目标合成孔径雷达图像进行图像剪裁，得到子图像集；对于子图像集对应的区域信息集中的每个区域信息，获取光学图像集；对于光学图像集组中的每个光学图像集，将光学图像集中的各个光学图像分别输入至油罐特征信息提取网络，得到特征图集；对于特征图集组中的每个特征图集，将特征图集中的各个特征图进行特征图融合，得到融合后特征图；对于所得到的融合后特征图集中的每个融合后特征图，生成第一油罐信息集中各个第一油罐信息的位置信息和各个第一油罐信息的半径信息；生成油罐布局信息。该实施方式可以准确、高效的生成油罐布局信息。
一种基于动态列车同步采样的图像校准系统 一种基于动态列车同步采样的图像校准系统
本发明涉及列车图像识别领域，具体是一种基于动态列车同步采样的图像校准系统，通过图像采集模块采集待测图像，并经过一级比对模块、二级比对模块和三级比对模块的检测比对，并通过校准分析模块对比对后的图像进行图像处理和校准，解决了现有技术中图像同步采样存在偏差、在后续列车检测过程中图像拼接和三维建模精度低，列车检测数据计算成本高的问题，通过使用精确校准后的图像，能够用于后续的异物检测、列车划痕检测和列车轨道缺陷检测等，达成了减少了数据检测成本，提高了检测效率，确保了列车运行的安全性和稳定性的有益效果。
一种基于图像分形维数的TBM破岩效率评价方法  一种基于图像分形维数的TBM破岩效率评价方法 
 本发明公开了一种基于图像分形维数的TBM破岩效率评价方法，涉及TBM施工评价研究技术领域，包括以下步骤:搭建获取岩渣图像的拍摄平台，对获取的岩渣图像进行预处理；依照Sandbox法基本原理，针对岩碴图像特点在原有模型的基础上进行改进，基于Matlab平台编写了图像分形维数的计算程序，把图片导入计算程序以获取图像分形维数；设计拍摄高度对比上述步骤所得图像分形维数的性能和适用条件，并与传统盒计数法进行了对比；分析图像分形维数与比能、粗糙度指数的相关性来确定其与TBM破岩效率的关系；本发明可以用于在某一项目中评价破岩效率，比较破岩效率是增大了还是减小了，进而调整施工策略。
一种用于肾病人员状态数据存储方法  一种用于肾病人员状态数据存储方法 
 本发明涉及图像数据处理技术领域，具体涉及一种用于肾病人员状态数据存储方法，包括:根据获取CT图像的差值图像中像素点的灰度值，获得有效像素点和无效像素点，根据有效像素点和无效像素点之间的差异，将差值图像进行迭代划分，根据划分结果构建树结构，实现对肾病人员相关状态的图像数据进行智能存储。本发明利用CT图像的基本特征，对图像进行差分处理，随后结合CT差值图的像素分布规律，进行差值图压缩存储，从而进一步提高了压缩率，大大节省了存储空间，优化了存储空间资源的使用率。
一种建筑物立体毁伤检测方法  一种建筑物立体毁伤检测方法 
 本发明公开了一种建筑物立体毁伤检测方法，包括:一、用无人机搭载可见光成像仪对目标建筑物进行影像采集，得到覆盖整个目标建筑物的多幅建筑物影像，并生成建筑物‌DSM模型；二、目标建筑物顶部高程图像的获取；三、目标建筑物高程变化的检测；四、目标建筑物顶部毁伤的检测；五、目标建筑物侧面毁伤的检测；六、目标建筑物毁伤可视化。本发明方法步骤简单、设计合理，利用无人机多角度拍摄目标建筑物的影像，实现目标建筑物的高程变化、顶部毁伤和侧面毁伤的检测，实现目标建筑物毁伤的整体可视化。
一种不同软件之间的含油饱和度数据传递方法  一种不同软件之间的含油饱和度数据传递方法 
 本发明涉及石油与天然气工程技术领域，尤其涉及一种不同软件之间的含油饱和度数据传递方法，包括以下步骤:1)获取第一可视化图像，所述第一可视化图像包含含油饱和度信息，将所述第一可视化图像进行灰度化处理；2)通过图像阈值分割法对灰度化处理后的第一可视化图像进行图像分割处理，将分割处理后的图像进行数值化处理，建立灰度值与含油饱和度数值之间的映射关系；3)基于灰度值与含油饱和度数值之间的映射关系，通过数值化的灰度值获取第二可视化图像，所述第一可视化图像包含含油饱和度信息。本发明能够实现不同软件之间的含油饱和度数据传递，提升数据传递的处理效率，促进跨软件的数据共享。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工