音频图像融合三维建模技术与装置 音频图像融合三维建模技术与装置
本技术涉及计算机视觉技术领域,公开了一种基于音频和图像融合的三维模型生成方法及设备,方法包括获取音频数据;对所述音频数据进行特征提取,得到音频特征向量;将所述音频特征向量通过训练好的对抗扩散生成模型映射为若干张第一二维图像;初始化一个三维模型,并利用所述音频特征向量从若干个随机角度渲染所述三维模型,生成若干个视角的第二二维图像;根据所述音频特征向量、所述第一二维图像和所述第二二维图像,对所述三维模型进行迭代优化,生成最终的三维模型。本发明能够学习音频和图像之间的复杂映射关系,保证了三维模型从多个视角学习三维场景的特性,不需要大规模三维标注数据集,实现了高质量和多样性兼具的三维模型生成。
创新中文艺术海报设计技术、系统、设备及存储解决方案 创新中文艺术海报设计技术、系统、设备及存储解决方案
本技术公开了一种中文艺术海报生成方法、装置、计算机设备及存储介质,方法包括:基于背景图像和中文宣传文本,生成中文宣传文本在背景图像中的中文布局信息;基于中文布局信息对背景图像进行图像定位和分割,得到中文宣传文本所在区域的局部图像,并基于中文宣传文本和局部图像,采用目标预测模型进行文本风格预测,得到文本风格信息;基于文本风格信息对中文宣传文本进行风格和图形转换处理,生成目标中文图形;基于中文布局信息,将目标中文图形融合至背景图像得到中文艺术海报。本实施例中,可以提高中文艺术海报中字体准确性和风格多样化,能够有效提高中文艺术海报的视觉效果,在提高了中文艺术海报的生成效率的同时还兼顾了其生成质量。
智能道路黑烟车辆检测技术与系统 智能道路黑烟车辆检测技术与系统
本技术适用于黑烟车辆识别技术领域,提供了一种马路黑烟车辆识别方法和系统。本发明通过选择多个公共辅助车辆;进行定位和启停识别,选择目标辅助车辆;接收监测拍摄片段,提取代表检测图像;进行灰度化处理,获取灰度统计数据;计算可疑范围占比,在可疑范围占比大于预设的标准范围占比时,进行车辆识别,获取黑烟车辆信息。能够从多个公共辅助车辆中,选择目标辅助车辆,接收监测拍摄片段,提取代表检测图像,进行灰度化处理与分析,计算可疑范围占比,并在可疑范围占比大于预设的标准范围占比时,识别黑烟车辆信息,无需在马路的监控杆或龙门架上安装监测设备,有效提高了黑烟车辆的监测识别范围,且极大的降低了马路黑烟车辆识别的成本。
多模态时空数据分析的多层网络状态预测技术 多模态时空数据分析的多层网络状态预测技术
本技术涉及一种基于多模态时空数据建模的多层网络状态预测方法,包括以下步骤:获取多层动态网络中能够反映各节点交互的时空多模态数据;基于时空多模态数据,通过伯努利分布和泊松分布将节点的连通性和属性信息与网络群组相关联,建立具有共享群组的多层时空Hawkes过程,以捕获每层节点之间从历史事件到后续事件的相互作用,构建多模态时空模型;利用具有局部收敛性的分层期望‑极大值算法进行多模态时空模型的参数求解,得到网络状态预测结果。与现有技术相比,本发明具有建模精准、预测准确等优点。
智能动画视频帧对话生成系统 智能动画视频帧对话生成系统
本技术公开了动画视频帧智能选择对话生成系统,具体涉及计算机视觉技术领域,将角色库中的动画视频转换为视频帧序列,使用计算机视觉技术检测每一帧中出现的角色,并进行跟踪,对于检测到的角色,提取其外观特征,将提取的角色的外观特征和角色库中获取的角色外观特征进行匹配,确定检测到的角色的身份,建立一个角色音色库,包括音频数据和已标注的音色,从音频数据中提取音频特征并进行音色识别,将识别出的音色与预先标注的角色音色进行匹配,根据音色识别结果,将每个角色的对话内容抽取出来,并将对话内容转换成文本形式,对抽取出的对话内容进行主题相似度判断,根据判断结果,将具有相似主题的对话内容进行修改,以生成新的对话内容。
多协议兼容的集成会话管理技术与设备 多协议兼容的集成会话管理技术与设备
本技术提供一种支持多协议转换的统一会话管理方法及相关设备。该方法通过维护原‑目标协议会话映射表和目标协议包头信息存储来对会话进行管理;其中,所述原‑目标协议会话映射表包括N个条目,每个条目包括原协议会话标识和目标协议会话序号;其中,所述目标协议会话序号用于指示目标协议包头信息存储的地址。本发明可有效降低不同协议会话管理和参数更新的难度,提高硬件的利用率。
融合检测技术在底稿图像识别中的应用系统与方法 融合检测技术在底稿图像识别中的应用系统与方法
本技术公开了一种基于融合检测的底稿图像识别系统及方法,属于光学字符识别技术领域,其方法具体包括:获取底稿图像,并对获取的底稿图像进行预处理,对预处理后的底稿图像进行角度识别,并进行旋转校正处理,对旋转校正后的底稿图像中的文本位置进行识别,根本识别出的底稿图像中的文本位置,对底稿图像中文本内容进行识别,通过融合多种检测方法,可以综合各自的优点,减少单一方法的缺陷,提高底稿图像的识别精度,该方法适用于各种复杂的底稿图像识别场景,包括但不限于金融领域的底稿图像等。
自动化CT系统中心投影参数优化技术 自动化CT系统中心投影参数优化技术
本技术一种CT系统中心投影参数自动化计算与调整方法,涉及工业CT技术领域。通过调整CT发光基点的光锥照射至探测器感应板内;开启CT发光基点,通过调整第一定位平台的Z、X的位移,调整第三定位平台X、Y的位移,将检测板的投影调整在探测器感应板内显示;记录检测球投影到探测器感应板的点位;偏移探测器感应板对多次偏移探测器感应板上的四点数据进行记录与结合,计算出四条直线,利用四条直线计算CT发光基点的中心坐标;将CT发光基点的中心调整到与探测器感应板的中心点在同一轴线上。达到降低了对用于矫正的四点模型精确计算的繁琐操作,只要采用简易的、精度要求较低的四点模型,只通过手动加工就可满足要求。
拓扑重建技术在义齿牙冠曲面生成中的应用 拓扑重建技术在义齿牙冠曲面生成中的应用
本文涉及图像数据处理技术领域,尤其涉及一种基于拓扑重建的义齿牙冠曲面生成方法。方法包括:获取目标用户的牙齿在目标缺牙处的点云数据,并对点云数据进行三角剖分处理获得初始三角网格模型;确定初始三角网格模型中的三角形所形成的顶点的第一评价值;根据初始三角网格模型中共边的三角形对的顶点的第一评价值,确定三角形对的顶点的权重;根据三角形对所包括的四个顶点的权重,对初始三角网格模型中的三角形对进行曲面细分处理,获得目标三角网格模型;在目标三角网格模型的目标参数值满足预设条件的情况下,根据目标三角网格模型生成义齿牙冠。通过以上技术方案能够提高所生成的义齿牙冠的使用寿命。
物资称重自动抓拍技术 物资称重自动抓拍技术
本技术图像通信技术领域,尤其涉及一种基于物资称重影像画面的自动抓拍获取方法。所述方法包括以下步骤:对现场物资以及车辆进行基于多传感器的信息采集,并进行基于时空坐标系的点云配准处理,从而得到异构物资体素数据,其中多传感器包括结构光视觉传感器、激光雷达传感器以及高分辨率相机传感器;对异构物资体素数据进行视觉语境分析,从而得到视觉语境特征图谱;对视觉语境特征图谱进行基于结构光视觉进行深度估计,并进行体素到体素的射线追踪,从而得到三维几何网格模型;将三维几何网格模型分割为若干微小的几何面元,得到微面元分割数据。本发明通过构建视觉语境特征图谱全面感知物品、车辆以及场景语境,提高了对复杂场景的适应性。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工