本技术公开了一种适用于水下姿势聚类的方法及装置,涉及水下手势识别技术领域,包括S1、通过训练一个深度网络,来学习有用的图像表示,让目标点均匀地分散在d维空间上;S2、目标转换向量进行归一化操作;若都均匀分布,使用混合高斯分布将向量,投影到球面;S3、在优化聚类目标的同时,卷积神经网络模型学习图像表征,并对图像分类。该适用于水下姿势聚类的方法及装置,提出了一个无监督聚类方法,以端到端方式构建深度神经网络,在没有额外处理的情况下提供姿态图像的直接聚类分配;采用多模态深度聚类,训练深度网络将图像嵌入与从高斯混合模型分布中采样的目标点对齐,通过图像嵌入的混合分量关联来确定聚类分配。
背景技术
在许多水下任务中,自动水下机器人(auv)由人类潜水员陪同,由于无法说话,他们通过不同的手势进行非语言交流。然而,由于缺乏注释数据集,水下手势识别在计算机视觉中是一个相对欠发达的领域。主要有两个挑战:首先,水下图像存在对比度低、模糊、色彩失真和模糊等问题;因此,传统的手势识别方法在分析它们时面临着问题。其次,现有的手势识别模型主要是有监督的,并且只能从用于训练模型的预定义集合中识别手势,显然不可能列举所有手势,不可能为人类潜水员在野外可能使用的每一个可能的手势收集数千张标记图像。
此外,水下手势识别算法的可扩展性和可维护性也存在一定的问题。随着水下作业领域的不断发展和应用需求的不断增加,手势识别算法需要不断地进行更新和升级。然而,目前的水下手势识别算法在可扩展性和可维护性方面仍存在一定的不足,难以满足未来应用的需求。
因此,急需对此缺点进行改进,本发明则是针对现有的技术及不足予以研究改良,提供有一种适用于水下姿势聚类的方法及装置。
实现思路