本公开涉及数据处理技术领域,提供了慢查询语句的确定方法及装置。该方法包括:获取第一查询语句集合,其中,第一查询语句集合包括多条结构化查询语句;按照第一预设规则筛选第一查询语句集合,得到第二查询语句集合;按照预设要素对第二查询语句集合中的结构化查询语句进行分组,得到第三查询语句集合;获取第三查询语句集合中每个小组中每条结构化查询语句对应的响应时间,并将第三查询语句集合中每个小组中的结构化查询语句按照每条结构化查询语句对应的响应时间从小到大的顺序进行排序;将排序后的第三查询语句集合中的每个小组中从后到前预设比例的结构化查询语句确定为慢查询语句。
背景技术
现有技术将响应时间超过指定时间的结构化查询语句称为慢查询语句,慢查询语句很可能导致集群资源紧张、服务挂掉和系统瘫痪等的生产事故,使得用户使用满意度大大降低。针对上述问题,首先需要确定出哪些结构化查询语句是慢查询语句,然后分析慢查询语句的原因,进而避免集群资源紧张、服务挂掉和系统瘫痪等的生产事故,提高用户使用满意度。但是目前确定出慢查询语句,往往是设定一个时间,将响应时间超过设定时间的结构化查询语句确定为慢查询语句,这种方法因为设定时间是固定的,对于所有的结构化查询语句集合或者小组并不准确。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:确定慢查询语句准确率低的问题。
实现思路