音频图像融合三维建模技术与装置

123技术园

首页 / 技术内容

音频图像融合三维建模技术与装置

2025-02-13 21:27

No.1339709494015565824

技术概要

PDF全文

本技术方案属于计算机视觉领域，介绍了一种融合音频和图像信息的三维模型构建方法及其设备。该方法首先收集音频数据，然后对音频数据进行特征提取以获得音频特征向量；接着，将音频特征向量与图像数据结合，通过特定的算法生成三维模型。该技术能够有效地利用音频和图像信息，提高三维模型的真实感和准确性。

背景技术

在人工智能领域，将音频和图片转换为三维模型的技术正逐渐成熟，这对增强现实、虚拟现实和游戏开发等行业具有重要意义。该技术能够提供更加丰富和互动的用户体验。现有的方法通常依赖于大量的三维训练数据，并结合深度学习和计算机视觉技术。这些方法通过提取音频和图像中的特征，将其映射到三维空间中，从而生成三维模型。然而，这些技术在数据处理过程中会面临较大的计算量，并且生成的模型常常与输入数据的同步性不足，表情和动作的自然性难以保证，生成的三维模型往往缺乏细节和逼真度，存在质量低和多样性低的缺陷。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

徐亚波牟昊李旭日何宇轩黄于晏

技术所属：广东横琴数说故事信息科技有限公司

相关技术

一种面向实时感知数据的去中心化预言机服务系统及方法  一种面向实时感知数据的去中心化预言机服务系统及方法 
 本申请的实施例涉及一种面向实时感知数据的去中心化预言机服务方法、电子设备和可读存储介质，通过获取传感器感知数据；判断预构建的预言机服务系统模型中各节点的网络状态请求是否超时，若网络状态请求超时，则基于共识协议中的网络状态发现算法更新各服务节点的网络状态，和/或基于共识协议中的可靠视图更改算法更新领导节点，得到网络状态达成共识的各节点；基于复合真值发现算法处理各节点中的传感器感知数据得到预言机真值推理数据，以实现对物联网传感器流式数据的实时、准确的真值推断，本发明还设计了DPS‑BFT共识协议，允许服务节点在部分同步拜占庭网络中自由加入或离开，而不影响网络的整体性能。
一种基于音频和图像融合的三维模型生成方法及设备  一种基于音频和图像融合的三维模型生成方法及设备 
 本发明涉及计算机视觉技术领域，公开了一种基于音频和图像融合的三维模型生成方法及设备，方法包括获取音频数据；对所述音频数据进行特征提取，得到音频特征向量；将所述音频特征向量通过训练好的对抗扩散生成模型映射为若干张第一二维图像；初始化一个三维模型，并利用所述音频特征向量从若干个随机角度渲染所述三维模型，生成若干个视角的第二二维图像；根据所述音频特征向量、所述第一二维图像和所述第二二维图像，对所述三维模型进行迭代优化，生成最终的三维模型。本发明能够学习音频和图像之间的复杂映射关系，保证了三维模型从多个视角学习三维场景的特性，不需要大规模三维标注数据集，实现了高质量和多样性兼具的三维模型生成。
中文艺术海报生成方法、装置、计算机设备及存储介质  中文艺术海报生成方法、装置、计算机设备及存储介质 
 本发明公开了一种中文艺术海报生成方法、装置、计算机设备及存储介质，方法包括:基于背景图像和中文宣传文本，生成中文宣传文本在背景图像中的中文布局信息；基于中文布局信息对背景图像进行图像定位和分割，得到中文宣传文本所在区域的局部图像，并基于中文宣传文本和局部图像，采用目标预测模型进行文本风格预测，得到文本风格信息；基于文本风格信息对中文宣传文本进行风格和图形转换处理，生成目标中文图形；基于中文布局信息，将目标中文图形融合至背景图像得到中文艺术海报。本实施例中，可以提高中文艺术海报中字体准确性和风格多样化，能够有效提高中文艺术海报的视觉效果，在提高了中文艺术海报的生成效率的同时还兼顾了其生成质量。
一种马路黑烟车辆识别方法和系统  一种马路黑烟车辆识别方法和系统 
 本发明适用于黑烟车辆识别技术领域，提供了一种马路黑烟车辆识别方法和系统。本发明通过选择多个公共辅助车辆；进行定位和启停识别，选择目标辅助车辆；接收监测拍摄片段，提取代表检测图像；进行灰度化处理，获取灰度统计数据；计算可疑范围占比，在可疑范围占比大于预设的标准范围占比时，进行车辆识别，获取黑烟车辆信息。能够从多个公共辅助车辆中，选择目标辅助车辆，接收监测拍摄片段，提取代表检测图像，进行灰度化处理与分析，计算可疑范围占比，并在可疑范围占比大于预设的标准范围占比时，识别黑烟车辆信息，无需在马路的监控杆或龙门架上安装监测设备，有效提高了黑烟车辆的监测识别范围，且极大的降低了马路黑烟车辆识别的成本。
一种基于多模态时空数据建模的多层网络状态预测方法  一种基于多模态时空数据建模的多层网络状态预测方法 
 本发明涉及一种基于多模态时空数据建模的多层网络状态预测方法，包括以下步骤:获取多层动态网络中能够反映各节点交互的时空多模态数据；基于时空多模态数据，通过伯努利分布和泊松分布将节点的连通性和属性信息与网络群组相关联，建立具有共享群组的多层时空Hawkes过程，以捕获每层节点之间从历史事件到后续事件的相互作用，构建多模态时空模型；利用具有局部收敛性的分层期望‑极大值算法进行多模态时空模型的参数求解，得到网络状态预测结果。与现有技术相比，本发明具有建模精准、预测准确等优点。
动画视频帧智能选择对话生成系统  动画视频帧智能选择对话生成系统 
 本发明公开了动画视频帧智能选择对话生成系统，具体涉及计算机视觉技术领域，将角色库中的动画视频转换为视频帧序列，使用计算机视觉技术检测每一帧中出现的角色，并进行跟踪，对于检测到的角色，提取其外观特征，将提取的角色的外观特征和角色库中获取的角色外观特征进行匹配，确定检测到的角色的身份，建立一个角色音色库，包括音频数据和已标注的音色，从音频数据中提取音频特征并进行音色识别，将识别出的音色与预先标注的角色音色进行匹配，根据音色识别结果，将每个角色的对话内容抽取出来，并将对话内容转换成文本形式，对抽取出的对话内容进行主题相似度判断，根据判断结果，将具有相似主题的对话内容进行修改，以生成新的对话内容。
支持多协议转换的统一会话管理方法及相关设备  支持多协议转换的统一会话管理方法及相关设备 
 本发明提供一种支持多协议转换的统一会话管理方法及相关设备。该方法通过维护原‑目标协议会话映射表和目标协议包头信息存储来对会话进行管理；其中，所述原‑目标协议会话映射表包括N个条目，每个条目包括原协议会话标识和目标协议会话序号；其中，所述目标协议会话序号用于指示目标协议包头信息存储的地址。本发明可有效降低不同协议会话管理和参数更新的难度，提高硬件的利用率。
一种基于融合检测的底稿图像识别系统及方法  一种基于融合检测的底稿图像识别系统及方法 
 本发明公开了一种基于融合检测的底稿图像识别系统及方法，属于光学字符识别技术领域，其方法具体包括:获取底稿图像，并对获取的底稿图像进行预处理，对预处理后的底稿图像进行角度识别，并进行旋转校正处理，对旋转校正后的底稿图像中的文本位置进行识别，根本识别出的底稿图像中的文本位置，对底稿图像中文本内容进行识别，通过融合多种检测方法，可以综合各自的优点，减少单一方法的缺陷，提高底稿图像的识别精度，该方法适用于各种复杂的底稿图像识别场景，包括但不限于金融领域的底稿图像等。
一种CT系统中心投影参数自动化计算与调整方法 一种CT系统中心投影参数自动化计算与调整方法
本发明一种CT系统中心投影参数自动化计算与调整方法，涉及工业CT技术领域。通过调整CT发光基点的光锥照射至探测器感应板内；开启CT发光基点，通过调整第一定位平台的Z、X的位移，调整第三定位平台X、Y的位移，将检测板的投影调整在探测器感应板内显示；记录检测球投影到探测器感应板的点位；偏移探测器感应板对多次偏移探测器感应板上的四点数据进行记录与结合，计算出四条直线，利用四条直线计算CT发光基点的中心坐标；将CT发光基点的中心调整到与探测器感应板的中心点在同一轴线上。达到降低了对用于矫正的四点模型精确计算的繁琐操作，只要采用简易的、精度要求较低的四点模型，只通过手动加工就可满足要求。
一种基于拓扑重建的义齿牙冠曲面生成方法 一种基于拓扑重建的义齿牙冠曲面生成方法
本申请涉及图像数据处理技术领域，尤其涉及一种基于拓扑重建的义齿牙冠曲面生成方法。方法包括:获取目标用户的牙齿在目标缺牙处的点云数据，并对点云数据进行三角剖分处理获得初始三角网格模型；确定初始三角网格模型中的三角形所形成的顶点的第一评价值；根据初始三角网格模型中共边的三角形对的顶点的第一评价值，确定三角形对的顶点的权重；根据三角形对所包括的四个顶点的权重，对初始三角网格模型中的三角形对进行曲面细分处理，获得目标三角网格模型；在目标三角网格模型的目标参数值满足预设条件的情况下，根据目标三角网格模型生成义齿牙冠。通过以上技术方案能够提高所生成的义齿牙冠的使用寿命。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工