本技术提供了一种利用街景图像进行招牌三维位置计算的技术与设备,采用计算机视觉和三维重建技术,高效识别并校准众源开放街景数据中的招牌,以获得精确的招牌地理坐标。
背景技术
近年来,随着街景数据库和计算机视觉技术的快速发展,街景影像成为城市研究的重要数据源。其广泛应用于城市建成环境的评价、空间数据基础设施的创建与维护,以及地理信息系统的增强等方面。然而,在处理和分析这些互联网获取的开放街景图像时,由于街道环境复杂,图像通常缺乏详细的拍摄相机参数,导致精确定位目标地理实体的难度依然较大,这一挑战在城市研究与应用中亟待解决。
目前已有类似研究尝试从街景图像中计算目标物地理位置,但存在一些的缺点。现有技术一:基于街景图片的目标物地理位置及高度的三维量测算方法(CN106908043B),该方法在街景地图中根据目标物选定两个合适的视点,在两视点下分别获取三张不同视角的街景图片;根据三张街景图片计算出各视点下的目标物方位角,并结合视点坐标确定两条空间直线,提供空间直线交汇的方法计算目标物的实际高度和地理位置。该方法需要较多人工辅助工作,对于一个目标物需要多张视野较好,无遮挡的街景图片作为解算参考,处理过程效率较低。现有技术二:Noorian等人(Shahin Sharifi Noorian;Sihang Qiu;Achilleas Psyllidis;Alessandro Bozzon;Geert-Jan Houben.Detecting,Classifying, and Mapping Retail Storefronts Using Street-level Imagery[A].ICMR '20: Proceedings of the 2020 International Conference on MultimediaRetrieval[C],2020)提出了一种结合建筑物轮廓数据和街景图像元数据的店面地理位置估计算法。该算法从OSM(OpenStreetMap)众源开放平台中获取建筑物立面在鸟瞰视角下投影到地面的轮廓数据,并找到从街景拍摄点出发到目标店面中心点的空间射线与建筑轮廓的交点,计算交点的经纬度坐标以确定店面地理位置。该方法的主要缺点在于依赖第三方来源的辅助数据,可能存在数据精度不一致,数据可靠性难以得到保证等问题。综上,目前地理实体定位技术主要面临两点挑战。首先,现有方法在定位精度上存在不足;其次,街景数据源的特性带来了对齐挑战。在街景图像中,同一招牌可能会从多个角度和位置被拍摄,这显著增加了将多个检测对象映射到真实世界实体的复杂性。
实现思路