123技术园

首页 / 信息集成数字服务

本文公开了一种音频数据处理方法、装置、介质、设备及程序产品，可应用于人工智能、机器学习中的人工智能AI降噪、人工智能AI回声消除技术的研究。该方法包括:获取采集的原始音频数据，原始音频数据包括纯净语音音频数据和噪声音频数据；根据原始音频数据中的纯净语音音频数据和噪声音频数据，生成仿真带噪数据；根据原始音频数据或仿真带噪数据，生成用于模拟音频经过空间传递后产生变化的目标音频数据；对目标音频数据执行语音增强操作，以得到增强的目标音频数据。通过数学语言模拟音频经过各种空间的传递变化，生成多样化的目标音频数据，提出了更完备的仿真音频数据合成方法。

2025-02-21 17:32

配音音频分析技术：方法、设备、电子装置及存储介质配音音频分析技术：方法、设备、电子装置及存储介质

本文涉及一种配音音频分析方法、装置、电子设备和存储介质，该方法包括:获取配音演员的配音音频；根据配音音频确定配音音频对应的声谱图图像；根据声谱图图像以及预先分类的有问题的音频的声谱图图像判断配音音频是否存在发音异常；若判断结果为配音音频存在发音异常，根据声谱图图像以及预先分类的有问题的音频的声谱图图像确定发音异常类型。本申请通过对配音音频确定配音音频对应的声谱图图像，根据声谱图图像以及预先分类的有问题的音频的声谱图图像首先确定是否存在发音异常，在存在发音异常的情况下，根据声谱图图像以及预先分类的有问题的音频的声谱图图像确定发音异常类型，通过引进声谱图图像能快速、全面的解决语音工作者配音问题。

2025-02-15 13:40

物联网辅助下的老年人语音紧急救援技术与系统物联网辅助下的老年人语音紧急救援技术与系统

本技术涉及一种基于物联网的老人语音应急求救方法，属于专门适用于行政、商业、金融、管理、监督或预测目的的数据处理技术领域，所述方法包括:在接收到求救语音模糊信号时，对设定老人患者的应急求救语音片段进行时间轴上的均匀分割以获得各份信号幅值；使用深度神经网络模型基于物联网数据以及各份信号幅值智能识别应急求救语音片段对应的应急求救类型编码数值。本发明还涉及一种基于物联网的老人语音应急求救系统；通过本发明，针对现有技术中难以对虚弱的老人患者发出的模糊语音进行应急求救类型鉴别的技术问题，能够引入人工智能模型使用物联网数据对模糊的老人患者语音信号进行智能分析，从而解决了上述技术问题。

2025-02-15 11:15

车载智能语音交互系统与方法车载智能语音交互系统与方法

本技术实施例提供了车载语音远程交互方法和系统，包括:当与智能设备建立通信连接后，接收智能设备发送的激活请求信息；响应智能设备的激活请求信息，生成提示信息；将提示信息发送给智能设备，并接收智能设备发送的输入信息；采用预设语义处理算法，对输入信息进行处理，得到输入信息对应的指令信息；根据指令信息执行相应操作，并生成执行结果数据；将执行结果数据发送给智能设备；其中，激活请求信息为用户发起的语音对话信息，提示信息为已激活的响应信息；可以通过智能设备与车载语音助手的交互，控制车辆执行相应操作，从而提高用户体验。

2025-02-14 19:12

高效婴儿哭声识别技术高效婴儿哭声识别技术

本技术涉及互联网技术领域，公开了一种低资源婴儿哭声检测方法，包括如下步骤:使用1mixture的monophone单音子模型，状态数为209，进行初步匹配和筛选；对单音子模型的viterbi匹配得分进行排序，选择得分最高的N个结果对应的音素模型进行进一步的精细匹配；使用3mixture的triphone三音子模型，状态数为358，进行精细匹配和筛选；对多个三音子模型的viterbi匹配得分进行排序，选择得分最高的模型所对应的序号作为最终识别结果。本发明的技术方案通过采用基于低mixture数+多状态共享的模型降维方法和基于VAD触发的非实时计算方法，能够在保证识别算法准确率前提下，大幅度降低模型结构复杂度和计算复杂度，从而显著减少婴儿哭声检测算法所需的芯片硬件计算资源消耗。

2025-02-14 17:35

自适应FIR滤波器结合残差控制技术去除呼吸面罩内噪声自适应FIR滤波器结合残差控制技术去除呼吸面罩内噪声

本技术公开了一种带残差控制器的自适应FIR滤除面罩内呼吸声的方法及呼吸面罩，通过对每一帧音频信号进行处理，在自适应滤波的基础上又引入判决机制和残差控制函数，在呼吸声信号中自适应更新FIR滤波器系数，语音信号则算法停止更新系数，可以有效滤除面罩内的呼吸声和残留噪声，极大地提高了通信质量，同时不会损伤语音信号。

2025-02-14 15:14

深度学习驱动的智能语音识别技术、系统和存储介质深度学习驱动的智能语音识别技术、系统和存储介质

本技术涉及基于深度学习的人工智能语音识别方法、装置及介质，通过将用户的历史语音信息进行识别，并在识别结果与用户的历史文字输入信息、历史文字输入信息的相关词匹配时，将历史语音信息与与用户的历史文字输入信息、历史文字输入信息的相关词进行关联，生成数据样本对语音识别模型进行训练，使得语音识别模型的识别结果更接近用户的日常的工作生活环境，使得语音识别结果在用户的工作生活领域中更加精准。

2025-02-14 15:08

音频数据重采样技术、设备及存储介质音频数据重采样技术、设备及存储介质

本技术涉及音频数据重采样方法、电子设备及存储介质，包括:S1、获取初始音频数据；S2、获取初始采样率和目标采样率以及目标音频数据和目标采样点数；S3、在目标采样点数不为音频单位的整数倍时，获取最小剩余采样点数以得到累积偏移量；S4、在累积偏移量小于音频单位时执行S5，否则执行S6；S5、获取下一数据包为初始音频数据，执行S2；S6、根据上一目标音频数据的末位数据和当前目标音频数据的首位数据获取补偿音频，并在当前目标音频数据的首位数据之前添加补偿音频后传输；S7、将累积偏移量减去补偿音频对应的字节数后以得到更新后的累积偏移量，获取新的初始音频数据后执行S2。实施本发明能够保证重采样前后音频的时间序列同步。

2025-02-14 11:38

智能乐谱创作技术：方法、设备与存储解决方案智能乐谱创作技术：方法、设备与存储解决方案

本公开涉及语音处理技术领域，尤其涉及一种乐谱生成方法、装置、电子设备和存储介质，对音频数据进行文本识别，确定所述音频数据包含的各文本信息，以及所述各文本信息对应的时间信息，其中，每个文本信息包含至少一个文本字符，各时间信息表征包含有对应的文本信息的音频区间在所述音频数据中所占的时间段信息；基于已训练的音符识别模型，以所述音频数据对应的音频特征和各时间信息为输入参数，分别确定所述各时间信息内所述音频数据包含的音符数据；基于确定出的各音符数据和各文本信息，生成所述音频数据对应的乐谱数据。这样，能够提高乐谱的丰富程度和完整程度。

2025-02-14 11:36

全卷积深度学习在电子听诊器降噪技术中的应用全卷积深度学习在电子听诊器降噪技术中的应用

本技术涉及信号降噪，具体涉及基于时域全卷积深度神经网络电子听诊器自适应消噪方法，电子听诊器通过主采集通道采集带背景音干扰的心肺音信号，并通过远端采集通道同时采集背景音信号，输入到原始信号缓存空间，对原始信号缓存空间中主采集通道和远端采集通道分别进行归一化处理，得到归一化后的带背景音干扰的心肺音信号s和背景音信号x，将带背景音干扰的心肺音信号s和背景音信号x输入到包含自适应滤波器和自适应算法的ANC系统中，得到自适应滤波器输出y和系统误差e，将自适应滤波器输出y和系统误差e输入到训练好的全卷积深度神经网络中；本发明提供的技术方案能够有效克服无法在采集心肺音信号过程中有效消除环境噪声干扰的缺陷。

2025-02-14 11:23

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工