基于强化学习的步态学习方法、系统、设备及存储介质
2025-02-22 08:11
No.1342770862432198656
技术概要
PDF全文
本技术涉及四足机器人技术领域,具体提供一种基于强化学习的步态学习方法、系统、设备及存储介质,包括:收集历史专家策略执行过程中产生的多种状态作为初始化状态;利用预构建的深度强化学习模型,基于所述初始化状态执行步态学习,得到步态控制策略。本发明丰富了深度强化学习模型的初始状态,提升了学习得到的步态控制策略的适应性。
背景技术
灵活高效的运动控制是各类移动机器人特定功能得以实现的基础与前提。为此,机器人领域的学者们不断探索、优化机器人运动控制算法,致力于实现对复杂机器人可靠、精准与高效的控制。相比于轮式或履带式机器人,以四足仿生机器人为代表的腿足式机器人由于自身机械结构复杂等固有特点,其运动稳定性与环境适应性均有待提升。 近年来基于深度强化学习的四足仿生机器人步态控制算法逐渐兴起,即让四足机器人通过不断试错学习到合适的步态控制策略。目前,大多数强化学习任务采用固定的初始状态, 然而对于四足机器人,不同的初始状态对同一动作的影响是不同的。因此采用固定的初始状态,导致深度强化学习得出的策略适应性不强。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
范建国  徐加利  张伟  谭文浩  范金秋  魏致远  房体育  程吉禹  李腾  王佳程
技术所属: 山东能源集团有限公司  山东大学
相关技术
FPGA实现硬件逻辑实时仿真的方法及装置 FPGA实现硬件逻辑实时仿真的方法及装置
基于API和数据库的动态标定方法 基于API和数据库的动态标定方法
一种虚拟机的沙箱引擎更新方法、装置、设备和介质 一种虚拟机的沙箱引擎更新方法、装置、设备和介质
频域响应仿真与测量数据处理方法及装置 频域响应仿真与测量数据处理方法及装置
服务数据节点迁移方法、装置、电子设备及存储介质 服务数据节点迁移方法、装置、电子设备及存储介质
配送控制方法、装置、服务器、智能柜及机器人 配送控制方法、装置、服务器、智能柜及机器人
适用于硬件电路的高精度压缩方法、装置及电子设备 适用于硬件电路的高精度压缩方法、装置及电子设备
融合多源信息的打击目标智能识别方法和系统 融合多源信息的打击目标智能识别方法和系统
水利对象关联关系建立方法 水利对象关联关系建立方法
问题解答方法、装置、介质和电子设备 问题解答方法、装置、介质和电子设备
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利