基于深度学习的数字人交互视频业务实时分析方法及系统

123技术园

首页 / 技术内容

2025-02-25 09:26

No.1343876935364911104

技术概要

PDF全文

本技术公开了基于深度学习的数字人交互视频业务实时分析方法及系统，涉及人机交互领域；包括:数据采集模块，其负责采集用户与数字人的交互视频数据，包括用户的语音、手势和面部表情的多模态数据；预处理模块，对采集到的视频数据进行预处理，包括去躁、增强、特征提取、针对语音数据进行语音情感分析、针对手势和面部表情数据进行关键帧提取和特征点标注；深度学习分析模块，建立深度学习模型，利用深度学习模型识别用户的多模态数据。本发明通过采集用户的语音、手势、面部表情的多模数据，进行特征处理后进行多模融合，再进行加权处理后识别意图，从而能直接识别用户意图，解决了局限性问题。

背景技术

随着虚拟现实(VR)、增强现实(AR)及全息通信技术的快速发展，数字人作为重要的交互媒介，在影视、游戏、教育、医疗等多个领域得到广泛应用。经检索，中国专利公开号为CN116248812B的专利，公开了一种基于数字人交互视频的业务办理方法、存储介质及系统，该方法先生成多个固定话术数字人视频和灵活话术数字人视频，然后将灵活话术数字人视频和对应业务办理流程的固定话术数字人视频合并形成数字人交互视频并展示给用户，再根据用户的响应信息选取对应的其他固定话术数字人视频，与灵活话术数字人视频合并形成新的数字人交互视频并展示给用户，不断重复直至达到业务办理预设条件后进行业务办理。上述专利存在以下不足，其利用用户给出的响应还需要用户韧性操作，无法基于用于的多模数据分析用户意图，所以还存在一定的局限性。为此，本发明提出基于深度学习的数字人交互视频业务实时分析方法及系统

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

王冠

技术所属：上海维迈数字科技有限公司维迈科技股份有限公司.

相关技术

基于非易失存储器的分组数据持久化与更新方法  基于非易失存储器的分组数据持久化与更新方法 
 本发明公开了一种基于非易失存储器的分组数据持久化与更新方法，适用于需要频繁更新局部数据的存储管理场景，旨在优化数据更新的效率和延长存储器的使用寿命。针对传统非易失存储器在处理数据频繁更新时因块擦除导致的寿命缩短问题，本发明提出了一种基于追加写入的分组数据持久化与更新方法。该方法通过仅追加写入分组数据中发生变化的数据，避免了重复擦写整个存储块，有效减少了非易失性存储器的磨损，提高了存储效率。同时，本方法实现了掉电保护功能，并通过延时内存回收策略实现了磨损均衡功能，进一步延长存储器的使用寿命。
一种基于仿真优化的散货码头堆场垛位分配方法及系统  一种基于仿真优化的散货码头堆场垛位分配方法及系统 
 本发明提供一种基于仿真优化的散货码头堆场垛位分配方法及系统，所述方法包括:步骤S1：获取港口码头的列车信息、堆场堆存状态；步骤S2：对不同散货可用堆区进行划分，基于改进的鲸鱼优化算法，对可堆存垛位进行初步选择，得到初步垛位分配结果；步骤S3：基于作业均衡下固定‑随机结合的堆存策略对初步垛位分配结果进行调整，确定最终堆存垛位；步骤S4：获取仿真布局和仿真作业逻辑，构建仿真模型，输入码头参数，使用仿真模型运行垛位分配方法，得到散货堆存方案。本发明针对散货码头中存在的堆场空间利用不充分、垛位分配不科学等问题，提出了合理高效的堆场垛位分配方法，保证堆场作业任务的连续性，提高散货码头堆场的堆存能力。
基于图注意力增强的强化学习的物联网防御方法  基于图注意力增强的强化学习的物联网防御方法 
 本发明涉及网络安全技术领域，尤其涉及在物联网网络实现自高效自主防御。包括:构建网络攻防场景，利用图数据结构对观察信息建模；对攻击者与防御代理的动作空间进行建模；对网络攻防场景中的攻防过程进行建模；采用图归一化对节点的特征矩阵进行归一化处理；利用GAT的自注意机制，根据网络设备与其相邻设备的交互动态聚合每个设备的当前状态信息；利用图下采样池化策略根据自注意力得分选择性保留节点主机；利用图注意力网络增强的强化学习算法训练防御代理。本发明解决现有强化学习算法的自动化防御在复杂网络场景中面临性能瓶颈，难以收敛到较高的回报值，无法制定有效的防御策略的问题。
一种基于拉伊达准则的救援井定位结果稳定性评估方法  一种基于拉伊达准则的救援井定位结果稳定性评估方法 
 本申请属于救援井定位结果稳定性评估技术领域。本申请提供一种基于拉伊达准则的救援井定位结果稳定性评估方法。本公开实施例针对利用改进贝塞尔模型对事故井定位算法中最优化算法得到的定距结果存在奇异值从而导致数据稳定性评估准确度不高的情况，通过利用拉伊达准则对优化算法得到的定距结果的奇异值进行剔除，进而对剔除后的数据组进行稳定性评估。该方法在一定程度上判断错误的最优结果，并对其进行剔除，使最优化结果数据更合理。该方法实现体量小，实现效果高，不需要人为对结果数据进行二次判断，提高了部分最优化算法结果处理的速度。该方法结合相关统计物理量，对处理后的数据进行稳定性分析，稳定性结果直观、准确。
一种基于大模型知识的跨模态行人搜索关键语义完备对齐方法  一种基于大模型知识的跨模态行人搜索关键语义完备对齐方法 
 本申请属于计算机视觉和自然语言处理技术领域。本申请提供一种基于大模型知识的跨模态行人搜索关键语义完备对齐方法。本公开实施例利用预训练视觉语言大模型所含外部通用知识提取更具判别力的视觉特征和文本特征；设计噪声过滤模块，通过参考模态内的全局和局部语义间的关系，滤除图像和文本中与行人无关的噪声，仅保留与行人相关的细粒度关键语义信息；提出关键语义显著性与完整性联合优化的完备学习模块，同时考虑显著性和完整性两方面的协同关系，实现跨模态行人关键语义信息的完备对齐。能够过滤行人无关的噪声信息，增强模型对行人相关的关键信息的关注度，挖掘跨模态细粒度信息之间的对应关系，进而提升跨模态行人检索的准确度。
一种航空发动机叶盘结构可靠性数实融合测试方法  一种航空发动机叶盘结构可靠性数实融合测试方法 
 本发明公开了一种航空发动机叶盘结构可靠性数实融合测试方法，应用于航空发动机时变可靠性评估领域。所述方法包括:采集叶盘结构全飞行循环下的关键部位的响应数据；建立有限元虚拟实体获得航空发动机叶盘结构全飞行循环下的时变输入变量和时变输出响应；建立物理信息嵌入的损失函数，并基于贝叶斯神经网络推断框架，建立最优的物理信息嵌入多重响应回归模型；提取大批量时不变数据集，利用所建多响应回归模型拟合极限状态函数，基于蒙特卡洛思想计算时变系统可靠度，完成时变系统可靠性评估。本发明将复杂的时变可靠性评估问题转换为时不变响应回归问题，在简化计算任务的同时有效提高计算精度。
一种面向卫星数实融合测试的多粒度多脉冲观测追踪训练方法  一种面向卫星数实融合测试的多粒度多脉冲观测追踪训练方法 
 本发明公开了一种面向卫星数实融合测试的多粒度多脉冲观测追踪训练方法，属于航天器数字化和计算机科学领域，该方法包括:数字孪生测试场景环境搭建、数字孪生卫星观测追踪模型构建、数字孪生多粒度多脉冲观测追踪训练和多粒度多脉冲观测追踪的卫星数实融合测试；设计卫星数实融合的多粒度多脉冲观测追踪训练方法，包括数字孪生追踪星多粒度多脉冲观测追踪机动策略和数字孪生目标星单粒度多脉冲逃逸机动策略，实现观测任务中多模型粒度与多脉冲变轨的卫星追踪训练和模型的数实融合修正。
一种基于Cycle-GAN的类不平衡条件下航空发动机轴间轴承故障诊断方法  一种基于Cycle-GAN的类不平衡条件下航空发动机轴间轴承故障诊断方法 
 本发明公开了一种基于Cycle‑GAN的类不平衡条件下航空发动机轴间轴承故障诊断方法，其具体包括:数据获取与预处理、改进并建立Cycle‑GAN模型、训练改进的Cycle‑GAN模型并完成信号转换、通过Cycle‑GAN模型完成实际振动信号的故障诊断。本发明提出了一种新的基于Cycle‑GAN的故障诊断迁移学习方法，通过改进的Cycle‑GAN模型将已知条件下的信号样本转换为未知条件下的新信号样本，提供数据分布更接近真实信号的转换信号的同时还能确保转换信号保留原始信号中的故障类别信息，解决实际场景中故障数据稀缺的问题，并利用转换信号对分类器进行训练，使得分类器能够区分未知条件下的故障数据。在实际工程应用中，尤其是类不平衡条件下航空发动机轴间轴承故障诊断问题中，本发明具有广阔的应用前景。
基于领域知识构建提示词进行粒计算的方法、设备及介质  基于领域知识构建提示词进行粒计算的方法、设备及介质 
 本发明公开了一种基于领域知识构建提示词进行粒计算的方法、设备及介质。方法包括以下步骤:获取领域知识，根据领域知识构建提示词；将提示词输入大语言模型，得到属性对概率矩阵；根据属性对概率矩阵判断待计算粒子之间的相关性；当待计算粒子之间的相关性达到要求时，对所述待计算例子进行粒计算操作。本发明实施例通过领域知识在粒计算过程中构建约束条件，能够减少粒计算过程中无效对象模式的发现，得出相关度更高的对象模式作为质量更高的推理结果。本发明实施例所得出的对象模式能够更好提示行业人员需要聚焦的属性信息，对问题求解提供更好的导向作用，广泛应用于不同行业领域的粒计算求解过程中。
超浅低对比度储层流体识别方法与系统  超浅低对比度储层流体识别方法与系统 
 本发明属于石油勘探开发技术领域，涉及一种超浅低对比度储层流体识别方法与系统，方法步骤为:获取靶区目标层的所有测井、录井原始响应数据；根据测井、录井原始响应数据计算衍生参数；从衍生参数中选择不同类型流体的特征；对选择的特征数据进行预处理得到标准化特征数据，并将其划分为训练集和测试集；以选择的特征为输入，流体类型为输出，通过训练集训练验证装袋树、LGBM和XGBoost三种模型；通过投票机制将训练测试后的三种模型动态集成为一个集成模型，通过测试集验证集成模型；将未知流体类型的储层段测井、录井响应数据及衍生参数输入至集成模型，预测流体类型。本发明能够快速准确识别海域超浅低对比度储层的流体性质。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工