高斯泼溅与3DMM模型结合的单目视频人脸重建技术

123技术园

首页 / 技术内容

2025-02-11 12:41

No.1338852433841102848

技术概要

PDF全文

本技术介绍了一种结合高斯泼溅与3DMM模型的单目视频人脸重建技术。该技术涉及将RGB视频帧转换为显式人脸网格，并利用高斯泼溅技术进行人脸特征提取，实现精确的人脸重建与动态驱动。

背景技术

从单目视频创建逼真的3D头部头像一直以来是计算机图形学中的一个挑战性问题。从任意视角渲染栩栩如生的头像能够在游戏、视频会议、增强现实（AR）和虚拟现实（VR）等多个领域提供丰富的应用场景。对于这些应用，问题的关键在于能否重建出高质量3D头部头像，并将其拓展至新姿势和表情下。通常，3D头部头像的重建被视为一项基础任务。近来，神经辐射场及其变体在静态场景重建方面取得了显著成效。后续的研究进一步将神经辐射场拓展至数字人建模领域。尽管这些方法在新视角合成方面表现出色，但往往缺乏可控性，限制了其对新姿势和表情的泛化能力。近期在3D高斯泼溅方面的进展在新视角合成的渲染质量上已超越神经辐射场，3D高斯泼溅将空间表示为3D高斯球，每个高斯球包含位置、旋转、尺度、不透明度和球谐系数，利用阿尔法混合将高斯球泼溅为最终渲染图像。由于渲染质量上的提高，3D高斯泼溅迅速被应用于数字人领域和虚拟头像生成领域中。现有技术通常依赖于三维人脸形变模型（3D Morphable Model, 简称3DMM）来进行单目视频的人脸重建。3DMM模型通过将人脸表示为一组参数化的几何形状和纹理特征，能够较好地实现面部特征的捕捉与重建。然而，传统3DMM模型在处理复杂的面部表情变化时常常面临细节不足的问题，例如眼睛、嘴巴和牙齿等区域的细节难以精确捕捉，这限制了模型的精度。此外，传统3DMM模型的训练和优化往往依赖于有限的数据集，而这些数据集的多样性不足以覆盖所有可能的面部特征变化，从而导致模型在真实场景中的适应性较差。在优化面部细节方面，现有技术常采用几何表情对齐的方法。然而，这些方法普遍依赖于固定的几何模型或预定义的关键点对齐方案，难以动态适应不同区域的特性。此外，现有的迭代最近点（ICP）算法虽然广泛应用于几何对齐任务，但其通常假设全局权重均匀分布，无法针对复杂区域（如眼睛和牙齿）赋予更高的权重优化，这导致局部区域的对齐精度受限。同时，传统ICP算法在收敛速度和全局优化能力上也存在不足，容易陷入局部最优解。在动态驱动方面，现有技术通常使用简单的线性变形或预定义的表情驱动模型。然而，这些方法在复杂的表情变化和非刚性变形中表现较差。例如，线性变形无法捕捉到面部肌肉的非线性变化，而传统的表情驱动模型往往局限于固定的表情类型，缺乏对动态变化的灵活支持。此外，在动态驱动过程中，现有技术通常难以平衡全局一致性与局部细节之间的关系，尤其是在面部区域的训练过程中，缺乏有效的学习策略调整手段，使得复杂区域（如眼睛和嘴巴）的训练难度被稀释，简单区域则占据过多计算资源，从而影响了整体效果。此外，为了提升渲染效果，许多现有方法尝试通过引入三维点云或体素表示来增强模型的表达能力。然而，这些方法往往计算量巨大，无法满足实时应用的需求。在渲染过程中，传统方法大多采用简单的损失函数对渲染结果进行优化，如均方误差（MSE）或结构相似性（SSIM），但这些指标无法充分捕捉感知相似性，导致最终生成的图像质量与真实图像之间仍存在显著差距。特别是在细节渲染上，现有技术缺乏对不同面部区域的重要性区分，使得复杂区域的细节质量较差，影响了整体渲染的视觉效果。综上所述，现有技术在单目视频人脸重建与驱动中存在以下主要问题和不足：第一，传统3DMM模型对细节区域的表达能力不足，尤其在眼睛和牙齿等区域的重建精度方面仍有较大提升空间；第二，几何对齐方法的优化能力有限，无法在复杂区域和全局优化之间取得平衡；第三，动态驱动模型在捕捉非线性表情变化和提高局部训练效率方面存在缺陷；第四，现有渲染优化方法在感知相似性和细节表达能力上不足，未能充分利用区域特性进行差异化优化。因此，如何提供基于高斯泼溅与3DMM模型的单目视频人脸重建与驱动方法是本领域技术人员亟需解决的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

黄章进殷博伟

技术所属：中国科学技术大学

相关技术

一种图像识别方法、装置、设备、介质及计算机程序产品  一种图像识别方法、装置、设备、介质及计算机程序产品 
 本发明涉及图像处理技术领域，具体公开了一种图像识别方法、装置、设备、介质及计算机程序产品，通过采用多分辨率图像样本训练视觉感知模型，并在迭代训练中通过分辨率两两之间的相似度系数计算多分辨率梯度正则项以调整不同分辨率图像特征的梯度数据间的关系，使视觉感知模型理解梯度下降方向差异较大的多种分辨率之间的差异以及理解梯度下降方向差异较小的多种分辨率之间的相似性，利用根据视觉感知损失值和多分辨率梯度正则项计算得到的模型学习损失值更新视觉感知模型的模型参数，解决视觉感知模型学习多种分辨率图像的感知能力时不同分辨率带来的图像特征不同、梯度数据间存在干扰导致模型优化难的问题，提高计算机视觉的分辨率泛化能力。
一种目标识别方法、装置、设备、介质及计算机程序产品  一种目标识别方法、装置、设备、介质及计算机程序产品 
 本发明涉及图像处理技术领域，具体公开了一种目标识别方法、装置、设备、介质及计算机程序产品，通过在视觉感知模型中添加用于对输入的图像特征进行尺寸调整的多分辨率泛化层，在利用多种分辨率图像样本训练视觉感知模型时，利用自监督损失的方式更新多分辨率泛化层的参数后，再将分辨率的图像样本输入视觉感知模型并计算得到感知损失值；利用各分辨率对应的感知损失值更新视觉感知模型的参数，由此进行迭代训练得到训练后的视觉感知模型，降低了不同分辨率图像样本的数据分布差异带来的优化难度，从而提升了视觉感知模型处理不同分辨率的输入图像的分辨率泛化能力，进而提升了目标识别任务适应不同分辨率的输入图像的分辨率泛化能力。
代价地图生成方法、设备、介质、产品及无人驾驶车辆  代价地图生成方法、设备、介质、产品及无人驾驶车辆 
 本发明公开了一种代价地图生成方法、设备、介质、产品及无人驾驶车辆，应用于自动驾驶技术领域。其中，方法包括基于栅格化处理且栅格设置空间体素的待检测行驶区域构建空白三维代价地图。通过对待检测行驶区域的图像数据和点云数据进行目标识别得到第一类障碍物的三维空间数据；基于目标视角下的图像数据和点云数据的融合特征，根据车辆前行过程中不断获取的各帧点云数据对应的栅格新高程信息更新当前时刻的空间体素权重，并基于更新后的空间体素权重确定第二类障碍物的三维形貌信息。将三维空间数据和三维形貌信息填充至空白三维代价地图生成三维代价地图。本发明可以解决相关技术无法精准规避障碍物，提升代价地图的丰富性，提升车辆避障能力。
基于熵权法和装箱算法的Modbus RTU跨TSN调度方法  基于熵权法和装箱算法的Modbus RTU跨TSN调度方法 
 本发明涉及一种基于熵权法和装箱算法的Modbus RTU跨TSN调度方法，属于数据交换网络领域。该方法首先将Modbus RTU数据帧转化为Modbus TCP数据帧，并根据数据类型和端到端时延要求划分数据帧优先级。随后，采用模糊层次分析法和熵权法选取合适的路径进行调度，将端到端时延、带宽和传输周期等因素作为路径选择的依据。最后，利用二维装箱算法进行异构网络的调度计算，生成调度表并指导数据流的传输。本发明有效提高了工业异构网络的数据传输效率和资源利用率，并降低了数据传输的延迟，为工业发展提供了技术支持。
一种基于状态引导以及种子变异的网络协议模糊测试方法和装置  一种基于状态引导以及种子变异的网络协议模糊测试方法和装置 
 一种基于状态引导以及种子变异的网络协议模糊测试方法和装置，其方法包括:1)根据官方RFC协议文档，手动构建高质量基础种子，并将种子与对应状态形成映射；2)将消息序列输入到目标程序进行模糊测试，与目标程序进行交互同时监测程序状态，并获取反馈；3)根据协议状态码以及路径覆盖率反馈，选取覆盖率高的种子进行信息保留变异，保留种子的状态转换功能，以减少无效种子的数量；4)状态引导消息序列生成：根据当前状态以及返回协议状态码，选取目标测试状态，优先选取未到达过或到达次数少的状态作为目标，然后根据基础种子生成能够到达或接近目标状态的消息序列。本发明提出的方法充分利用了协议的状态信息，并在种子变异过程中保留了种子的状态转换能力，通过状态引导以及针对性地消息序列生成，提高了网络协议模糊测试的效率以及质量。
基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法  基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法 
 本申请提供了基于纹理特征分析的接触式仪器三维轮廓缺陷检测方法，涉及图像处理技术领域，包括:按照图像与三维轮廓坐标的映射关系进行拟合，构建三维轮廓的图像分布坐标；通过滤波器组分别对三维轮廓的分布图像进行纹理识别，获得纹理特征及其分布坐标；根据纹理特征进行缺陷区域识别分离，获取缺陷识别区域，按照分布坐标对缺陷识别区域进行缺陷影响性评估，反馈缺陷检测结果。通过本申请可以解决传统缺陷检测方法对于表面纹理的精确提取和分析能力较弱，同时难以在复杂的三维表面上精确定位缺陷，导致缺陷检测结果的精准性、全面性和有效性不足的技术问题，可以达到精准定位缺陷区域，同时对缺陷影响程度进行有效评估的技术效果。
一种细胞图像配准方法及其装置  一种细胞图像配准方法及其装置 
 本发明实施例提供的细胞图像配准方法，包括:对第一明场细胞图像背景和目标亮度取反得到第二明场细胞图像，将第一荧光细胞图像作为第二荧光细胞图像；对第二明场细胞图像和第二荧光细胞图像中目标覆盖的像素数量多的一者进行腐蚀处理，得到第三明场细胞图像和第三荧光细胞图像；根据相位相关法、第三明场细胞图像和第三荧光细胞图像对第一明场细胞图像和第一荧光细胞图像进行配准。本发明实施例首先使得明场细胞图像、荧光细胞图像中背景和目标的相对亮度的方向相同，然后对明场细胞图像和荧光细胞图像中的一者进行腐蚀处理，经过该两步预处理后再采用相位相关法进行配准，明场细胞图像和荧光细胞图像中对应的目标质心对齐，配准更准确、稳定。
一种基于多模态信息融合的图像分类方法  一种基于多模态信息融合的图像分类方法 
 本申请公开了一种基于多模态信息融合的图像分类方法，涉及图像处理技术领域，该图像分类方法利用特征提取网络中的多尺度特征提取模块对每个模态的原始图像进行多尺度特征提取，多特征融合金字塔在FPN框架基础上结合空洞卷积层改进得到，可以有效地提取原始图像的上下文信息，多特征关联模块进一步增强多尺度特征关联，使得特征提取网络能得到原始图像的表征能力更强的单模态特征图，而在对两个单模态特征图进行多模态信息融合得到融合特征图后，除了使用融合特征图，还保留原始的单模态特征图一起利用分类网络进行分类，该方法可以充分挖掘模态内和模态间的图像信息，从而可以有效提升图像分类准确性和鲁棒性。
对象相对自身行进方向确定方法及装置  对象相对自身行进方向确定方法及装置 
 本说明书提供对象相对自身行进方向确定方法及装置，其中对象相对自身行进方向确定方法包括:获取待识别图像；在所述待识别图像中识别目标对象，获得所述目标对象的目标检测框信息和目标检测特征点信息；根据所述目标检测框信息和所述目标检测特征点信息，生成所述目标对象在所述待识别图像中的目标追踪特征点信息；根据所述目标追踪特征点信息，生成所述目标对象的朝向特征向量和位移特征向量；根据所述朝向特征向量和所述位移特征向量，确定所述目标对象相对自身的目标行进方向。实现对目标对象相对自身的目标行进方向的确定，提高确定目标行进方向的准确性。
染色体识别方法及系统  染色体识别方法及系统 
 本发明公开一种染色体识别方法及系统。该方法包括获取染色体数据；根据染色体数据训练扩散概率模型；将染色体图像的染色体掩膜二值图和染色体灰度归一化直方图以及染色体类别嵌入至特征向量中，使用交叉注意力机制将特征向量作用于扩散概率模型，生成染色体扩充数据；根据染色体扩充数据训练染色体识别网络；根据染色体识别网络对需要识别的染色体数据进行识别；本发明基于扩散概率模型的扩增数据方法，既保留了染色体的真实性，又成功转换了染色体的图像特性，有效扩大了数据的多样性。通过该系统，染色体在不同数据源上的识别效果得到了显著的提升，为医疗诊断领域提供了更为精确和可靠的辅助工具。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工