本技术公开了一种服务器闲置算力调度方法、装置及电子设备,包括:获取目标服务器集群中纳管的算力节点和Pod资源;确定每一个所述算力节点的CPU资源实际使用数据以及所述Pod资源中每一个Pod的CPU资源实际使用数据;根据所述算力节点的CPU资源实际使用数据以及对应的预设CPU使用阈值确定所述算力节点的当前使用状态;当任一所述算力节点的当前使用状态为空闲状态,根据所述Pod资源中未进行闲置算力配置的每一个Pod的CPU资源实际使用数据对所述算力节点进行扩容操作;当任一所述算力节点的当前使用状态为繁忙状态,根据所述算力节点已配置的每一个Pod的CPU资源实际使用数据对所述算力节点进行缩容操作。
背景技术
Kubernetes原生的调度器scheduler只负责为每一个未经调度的Pod资源、基于一系列的规则从集群中挑选一个合适的节点来运行。这种默认的调度器通过节点预选Predicate、节点优先级排序Priority,来挑选出最适合的节点,核心目标是基于资源可用性将各Pod资源公平地分布于集群节点之上。Kubernetes原生的QoS只是根据资源的limit、request资源限额,然后基于此给不同的Pod定义不同的QoS。原生的技术无法解决在服务器算力资源闲置时,如何充分和合理的调度Pod。
例如在大部分的业务场景中,业务都会呈现出波谷波峰的显著特点,如何在波谷时使用合理有效的资源调度策略进行资源调度成为亟待解决的问题,故亟待提出一种新的服务器闲置算力调度方法以提升资源利用率。
实现思路