抗歧义点技术在通用交互式图像编辑中的应用与系统
2025-02-09 11:29
No.1338109512820989952
技术概要
PDF全文
本技术介绍了一种利用抗歧义点技术的通用交互式图像编辑方法和系统。该技术领域专注于图像编辑,首先明确图像编辑任务的类型,并据此构建密集点集,进而计算点集特征,以实现图像编辑过程中的歧义消除和编辑效率提升。
背景技术
在数字化时代,图像编辑作为视觉内容创作与传播的重要手段,其效率和质量的提升一直是技术发展的焦点。随着计算机视觉和人工智能技术的快速发展,交互式图像编辑方法应运而生,通过捕捉用户的直接操作(如拖动、点击等)来实时调整图像内容,极大地提升了编辑的便捷性和直观性。 目前,大多数交互式图像编辑方法通过利用基于交互点的图像编辑模型去实现,但会在两个方面存在歧义性,一方面,在编辑意图的识别上,传统的基于交互点的图像编辑方法常面临误解用户的编辑意图,即多种可能的编辑结果会对应相同的交互点轨迹(编辑指令),例如,DragDiffusion算法在优化过程中过于关注控制点的位置更新,而忽视了用户背后具体的编辑任务,导致生成的编辑轨迹可能偏离用户预期,甚至出现不合理或易偏移的现象,而FreeDrag算法虽然通过限制轨迹形状(如直线)来缓解歧义问题,但这种二维轨迹无法完全表示诸如平面外旋转等三维操作,从而限制了编辑操作的多样性和灵活性,影响图像编辑质量;另一方面,在图像内容的处理上,现有方法大多依赖于用户指定的去噪时间步来选择控制点的潜在特征进行优化,然而,图像中的信息是多层次、多维度的,不同时间步或层次的特征包含了不同尺度和粒度的信息,对于复杂的编辑任务而言,由于单一时间步的潜在特征往往无法全面反映图像的真实状态和用户的编辑需求,仅利用一个时间步的潜在特征来生成令人满意的结果是不切实际的。因此,如何减少编辑意图上产生歧义,降低图像编辑难度和提高图像编辑质量,是极其重要的待解决的技术问题。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
林晓建  黎汉汇  梁小丹
技术所属: 中山大学·深圳  中山大学
相关技术
一种带HDMI输出模块的SDI信号采集卡 一种带HDMI输出模块的SDI信号采集卡
一种基于Jetson平台的边缘计算迷你主机设备 一种基于Jetson平台的边缘计算迷你主机设备
一体式超高频RFID读写器 一体式超高频RFID读写器
一种基于VR高空模拟系统及其使用方法 一种基于VR高空模拟系统及其使用方法
一种模块化工业算力设备 一种模块化工业算力设备
一种基于边缘计算和大数据算法的RV减速器信息管理系统 一种基于边缘计算和大数据算法的RV减速器信息管理系统
一种独柱墩桥梁加固后的健康监测预警方法及系统 一种独柱墩桥梁加固后的健康监测预警方法及系统
一种具有无极滚轮和侧滚轮的鼠标 一种具有无极滚轮和侧滚轮的鼠标
一种文本展示方法、装置、设备和存储介质 一种文本展示方法、装置、设备和存储介质
一种多级行政区划要素的快速检索与展示方法及系统 一种多级行政区划要素的快速检索与展示方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利