糖尿病视网膜病变小样本分类技术与系统 糖尿病视网膜病变小样本分类技术与系统
本技术公开了一种面向小样本的糖尿病视网膜病变的分类方法及系统,属于图像处理和医学领域,其中,分类方法由基于轻量级RexNet通道优化的预训练阶段,眼底图像数据预处理阶段,数据增强阶段,基于迁移学习的模型微调训练阶段,系统实现阶段组成;本发明解决了医学图像数据样本少和患者隐私问题,打破基层社区DR诊断能力不足的壁垒。同时结合迁移学习,在ImageNet进行预训练,得到预训练模型。对数据进行增强,提高糖尿病视网膜病变分类检测系统的准确度,降低计算成本,辅助基层社区针对糖尿病视网膜病变临床诊断,进行糖尿病视网膜病的预防筛查诊断。
深度学习驱动的眼镜识别与移除技术、系统与设备 深度学习驱动的眼镜识别与移除技术、系统与设备
本技术公开了一种基于深度学习的眼镜识别和眼镜移除方法、系统及设备,该方法包括:将人脸图像集输入眼镜字典进行鉴别,得到戴眼镜人脸图像集和不戴眼镜人脸图像集;根据第一划分器对戴眼镜人脸图像集进行划分,得到不透明眼镜人脸图像集和透明眼镜人脸图像集;根据第二划分器对透明眼镜人脸图像集进行划分,得到无框眼镜人脸图像集、半框眼镜人脸图像集和全框眼镜人脸图像集;基于生成对抗网络构建眼镜移除模型;将人脸图像集输入对应的眼镜移除模型进行眼镜移除,得到对应的无眼镜人脸图像集。本发明实现了基于多特征的眼镜移除,生成的无眼镜人脸图像在身份特征和视觉效果上均保持高度一致性。
基于M-N-CDFTransUNet的肺结节分割技术 基于M-N-CDFTransUNet的肺结节分割技术
本技术公开了一种基于M‑N‑CDFTransUNet网络模型的肺结节分割方法,属于医学图像处理技术领域,其方法包括以下步骤:对LIDC‑IDRI肺部数据集图像进行格式转换;依据K‑means和图像处理方式提取出肺实质部分;建立肺结节分割数据集,并分为训练集和验证集;建立改进的TransUNet算法的肺结节分割模型;对M‑N‑CDFTransUNet网络肺结节分割模型进行训练,训练后得到优化模型;对S4得到的M‑N‑CDFTransUNet网络肺结节分割模型进行验证;用验证优化后的模型对肺部图像进行识别。本发明能够整合不同层级的特征信息,从而增强对肺结节的全面理解和识别能力,并且提高模型整体特征提取性能,且提升模型泛化能力。
工业缺陷检测的模型量化技术与系统 工业缺陷检测的模型量化技术与系统
本技术公开了一种基于模型量化的工业缺陷检测方法及系统,方法包括:对缺陷检测模型使用模型量化法进行加速并封装后得到量化后的缺陷检测模型;将量化后的缺陷检测模型设置为工业内窥镜的启动程序,获取工业内窥镜拍摄的周围环境图像或视频;调用量化后的缺陷检测模型结合图像高低分辨率映射推理方法对周围环境图像或视频的数据进行实时推理检测得到检测结果。可以将提出的模型加速方法应用到目标检测模型中实现推理加速,并将加速后的模型部署到工业内窥镜设备当中,能够同时进行单帧图片以及视频流的高速推理,同时将检测方法部署到工业内窥镜设备当中,借助工业内窥镜的体积小等优势实现对狭小空间和非直线型等工业环境下的缺陷检测任务。
去中心化实时数据感知预言机系统与方法 去中心化实时数据感知预言机系统与方法
本文的实施例涉及一种面向实时感知数据的去中心化预言机服务方法、电子设备和可读存储介质,通过获取传感器感知数据;判断预构建的预言机服务系统模型中各节点的网络状态请求是否超时,若网络状态请求超时,则基于共识协议中的网络状态发现算法更新各服务节点的网络状态,和/或基于共识协议中的可靠视图更改算法更新领导节点,得到网络状态达成共识的各节点;基于复合真值发现算法处理各节点中的传感器感知数据得到预言机真值推理数据,以实现对物联网传感器流式数据的实时、准确的真值推断,本技术还设计了DPS‑BFT共识协议,允许服务节点在部分同步拜占庭网络中自由加入或离开,而不影响网络的整体性能。
音频图像融合三维建模技术与装置 音频图像融合三维建模技术与装置
本技术涉及计算机视觉技术领域,公开了一种基于音频和图像融合的三维模型生成方法及设备,方法包括获取音频数据;对所述音频数据进行特征提取,得到音频特征向量;将所述音频特征向量通过训练好的对抗扩散生成模型映射为若干张第一二维图像;初始化一个三维模型,并利用所述音频特征向量从若干个随机角度渲染所述三维模型,生成若干个视角的第二二维图像;根据所述音频特征向量、所述第一二维图像和所述第二二维图像,对所述三维模型进行迭代优化,生成最终的三维模型。本发明能够学习音频和图像之间的复杂映射关系,保证了三维模型从多个视角学习三维场景的特性,不需要大规模三维标注数据集,实现了高质量和多样性兼具的三维模型生成。
创新中文艺术海报设计技术、系统、设备及存储解决方案 创新中文艺术海报设计技术、系统、设备及存储解决方案
本技术公开了一种中文艺术海报生成方法、装置、计算机设备及存储介质,方法包括:基于背景图像和中文宣传文本,生成中文宣传文本在背景图像中的中文布局信息;基于中文布局信息对背景图像进行图像定位和分割,得到中文宣传文本所在区域的局部图像,并基于中文宣传文本和局部图像,采用目标预测模型进行文本风格预测,得到文本风格信息;基于文本风格信息对中文宣传文本进行风格和图形转换处理,生成目标中文图形;基于中文布局信息,将目标中文图形融合至背景图像得到中文艺术海报。本实施例中,可以提高中文艺术海报中字体准确性和风格多样化,能够有效提高中文艺术海报的视觉效果,在提高了中文艺术海报的生成效率的同时还兼顾了其生成质量。
智能道路黑烟车辆检测技术与系统 智能道路黑烟车辆检测技术与系统
本技术适用于黑烟车辆识别技术领域,提供了一种马路黑烟车辆识别方法和系统。本发明通过选择多个公共辅助车辆;进行定位和启停识别,选择目标辅助车辆;接收监测拍摄片段,提取代表检测图像;进行灰度化处理,获取灰度统计数据;计算可疑范围占比,在可疑范围占比大于预设的标准范围占比时,进行车辆识别,获取黑烟车辆信息。能够从多个公共辅助车辆中,选择目标辅助车辆,接收监测拍摄片段,提取代表检测图像,进行灰度化处理与分析,计算可疑范围占比,并在可疑范围占比大于预设的标准范围占比时,识别黑烟车辆信息,无需在马路的监控杆或龙门架上安装监测设备,有效提高了黑烟车辆的监测识别范围,且极大的降低了马路黑烟车辆识别的成本。
多模态时空数据分析的多层网络状态预测技术 多模态时空数据分析的多层网络状态预测技术
本技术涉及一种基于多模态时空数据建模的多层网络状态预测方法,包括以下步骤:获取多层动态网络中能够反映各节点交互的时空多模态数据;基于时空多模态数据,通过伯努利分布和泊松分布将节点的连通性和属性信息与网络群组相关联,建立具有共享群组的多层时空Hawkes过程,以捕获每层节点之间从历史事件到后续事件的相互作用,构建多模态时空模型;利用具有局部收敛性的分层期望‑极大值算法进行多模态时空模型的参数求解,得到网络状态预测结果。与现有技术相比,本发明具有建模精准、预测准确等优点。
智能动画视频帧对话生成系统 智能动画视频帧对话生成系统
本技术公开了动画视频帧智能选择对话生成系统,具体涉及计算机视觉技术领域,将角色库中的动画视频转换为视频帧序列,使用计算机视觉技术检测每一帧中出现的角色,并进行跟踪,对于检测到的角色,提取其外观特征,将提取的角色的外观特征和角色库中获取的角色外观特征进行匹配,确定检测到的角色的身份,建立一个角色音色库,包括音频数据和已标注的音色,从音频数据中提取音频特征并进行音色识别,将识别出的音色与预先标注的角色音色进行匹配,根据音色识别结果,将每个角色的对话内容抽取出来,并将对话内容转换成文本形式,对抽取出的对话内容进行主题相似度判断,根据判断结果,将具有相似主题的对话内容进行修改,以生成新的对话内容。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工