深度强化学习在智能排产动态调度中的应用
2025-02-13 11:30
No.1339559360803905536
技术概要
PDF全文
本研究提出了一种创新的智能排产动态调度方法,该方法利用深度强化学习技术。该方法涵盖了信息读取、数据处理、深度强化学习框架构建以及考虑实际生产环境因素的关键步骤,旨在提高排产效率和响应速度。
背景技术
目前相关技术中,智能排产动态调度方法大多基于最优化方法和近似/启发式算法。近年来,很多学者也开始使用深度强化学习来求解各种动态调度问题,包括智能排产动态调度问题。最优化方法主要包括混合整数线性规划(MILP)、分支定界法及拉氏松弛法等;近似/启发式方法最初氏由于计算量小并且算法易实现而引入的,主要包括优先分派规则(PDR)、神经网络(NN)及邻域搜索法(NS),邻域搜索法又包括禁忌搜索(TS)、遗传算法(GA)和模拟退火(SA)等可以称之为亚启发式(Meta-heuristic)的近似优化方法,最优化方法主要受计算规模的限制。由于对一个n×m的智能排产动态调度问题有(n!)×m种可能的解,因此大规模问题使用精确求解的计算方法上是不可行的。 目前深度强化学习模型(DRL)在智能排产动态调度问题上的研究已经有了较大进展,深度强化学习被广泛应用于解决各种动态调度问题。这类模型比传统的优先调度规则启发式更灵活,强化学习环境可以对随机决策和柔性问题进行建模,例如非确定性作业重新进入、工序间的串并行顺序、工序有多条产线可选、设备有多条产线可选等,但是上述处理方法大多还处于理论研究的阶段,还不能面向工厂真实需求的复杂约束建模,对于某些随机工厂停机、随机处理时间、订单截止时间等问题,无法提供满足工厂真实需求的智能排产动态调度方法;另外真实的工厂需求通常是要考虑到高级计划排程(APS),将短期计划和中长期计划分开建模,同时保证短期计划的精准性和长期计划的快速求解,这也是目前主流深度强化学习模型未能覆盖的领域。 为此,我们提出了基于深度强化学习的智能排产动态调度方法。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
宇文东方万光华
技术所属: 厦门深度赋智科技有限公司.
相关技术
一种防过压损坏的工业一体机主板 一种防过压损坏的工业一体机主板
一种带有防护功能的计算机数据设备 一种带有防护功能的计算机数据设备
一种基于蚁群算法的跨境贸易供应链调度优化方法 一种基于蚁群算法的跨境贸易供应链调度优化方法
一种寒区刚性加铺复合道面结构适航性能评价方法 一种寒区刚性加铺复合道面结构适航性能评价方法
基于气象模型预测机场航空排放物扩散的方法及装置 基于气象模型预测机场航空排放物扩散的方法及装置
基于KL散度和置换检验的概念漂移检测与解释方法 基于KL散度和置换检验的概念漂移检测与解释方法
代码缺陷预测方法、可读存储介质、计算机程序产品 代码缺陷预测方法、可读存储介质、计算机程序产品
基于DQN算法的重型卡车电池系统智能决策方法及相关设备 基于DQN算法的重型卡车电池系统智能决策方法及相关设备
一种基于引力交通模型的历史文化资源结构关系提取及可视化方法与系统 一种基于引力交通模型的历史文化资源结构关系提取及可视化方法与系统
一种超声内检测管道裂纹的三维数值模拟方法 一种超声内检测管道裂纹的三维数值模拟方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利