简述地理编码原理与实施方案

阅读: 评论:0

简述地理编码原理与实施⽅案
⼀、地理编码的定义:
地理编码也称作地址编码,是将地址本⽂描述转化为坐标的过程。
通过“北京市西城区西单北⼤街131号西单⼤悦城”,得到“坐标:39.910864,116.372857”的过程,既是地理编码。
⼆、地理编码的发展:
基于计算机技术的地理编码,在上世纪六⼗年代,美国⼈⼝统计局设计DIME模型和tiger数据库的时候,就有了技术雏形,⽽后随着计算机的普及和互联⽹的发展,地理编码渐渐由ToG转向了ToB、ToC领域。
natr-241三、地理编码的应⽤:
在ToG领域:
地理编码主要⽤于政府普查与管理⼈⼝;医疗卫⽣上,则是对流⾏病进⾏调查防控;公共安全上,通过定位犯罪现场,对犯罪分布与模式进⾏分析等。
在ToB领域:
地理编码可⽤于企业管理⽤户,对设备进⾏监控等。
在ToC领域:
最常见的应⽤就是,⽤户在地图搜索框中输⼊地址,查地址所在的位置,继⽽导航,根据导航提⽰,使⽤各种交通⼯具或步⾏抵达⽬的地。
总⽽⾔之,地理编码的应⽤都基于将地址⽂本转为坐标,根据坐标结果进⾏后续步骤。
四、地理编码的步骤:
《地理信息系统导论》⼀书中,将地理编码过程分为三个环节,预处理、匹配、标绘。
另外综合arcgis⽂档《地理编码过程》和论⽂《地理编码系统设计与实现》,整理的地理编码流程图如下:
1. 地理编码的技术环节:
放线菌培养基地理编码过程分三个环节,数据预处理、搜索匹配、标绘。
在这三个环节中,数据预处理的难点在于地址的标准化和结构化,中⽂地址与中⽂语⾔⼀样,充满了多样性,在对地址进⾏标准化与结构化的过程中,需要覆盖⾮常⼴泛的策略和词典做⽀撑,数据质量
越好、量级越⼤,结果就会越准确。
搜索匹配的重点是对输⼊⽂本的切分,和对召回结果的打分,如果切分效果不好,则不到数据库中的合适记录,如果打分规则设定的不好,输出的结果可能就不是想要的结果。
在标绘环节,如果搜索匹配的结果不完全吻合输⼊地址,需要基于线要素进⾏插值(包括单侧偏移和末端偏移),或获取⾯的质⼼(如果参考要素是⾯或点),来进⾏坐标修正。
1. 地理编码的评分标准:
对服务质量的评判主要有两个指标:
基于⽂本的匹配率;甲类功率放大器
定位准确度。
小型振动器
为了定位服务误差的原因,还需要确定性指标:
废塑料炼油预处理环节的确定度;
匹配环节的确定度;
标绘环节的确定度。
1. 地理编码的技术:
数据⽣产加⼯:地理编码需要海量数据与词典进⾏底层数据⽀撑,海量数据除了⾃采集加⼯外,还需要从各种平台爬取融合;词典除了积累,还有挖掘⽣成。在这⼀环节需要很多爬⾍和⾃然语⾔处理相关的技术。
地址本⽂预处理:地址⽂本需要去噪、标准化、结构化,这⼀过程需要⾃然语⾔处理的技术。
冰醋酸溶液(关于这部分,后续会补充⼀个中国计算科学技术⾃然语⾔处理的发展史。)
搜索匹配:关键点是搜索引擎的搭建,C语⾔搭建的搜索引擎⽆疑是效率最⾼的,但近些年,ElasticSearch的使⽤也很⼴泛。
标绘:最终结果的坐标展⽰,这个环节会涉及⼀些空间插值与聚类的计算,当然为了插值合理,最好要有路⽹数据。
五、总结:
地理编码是⼀个多技术、融合性⼯程应⽤,涉及到的技术包括GIS、NLP、搜索等,⽽这些技术,也是多学科交叉的领域,⽬前ToC的地理编码服务已经⾮常成熟了,各⼤图商都提供该服务。ToB领域,企业为管理⽤户地址,会建⽴地理编码服务。ToG领域,政府会⽤在⼈⼝普查、犯罪预防、流⾏病调查等⽅向。
因地址多样性和基础数据准确性、时效性的影响,地理编码服务的准确率是有瓶颈的,靠技术很难突破,要突破,恐怕只能靠⽣态模式的改变。
再看产品收益,ToC的产品很难获得盈利,ToB主要以企业⾃⽤为主,且很难打破⾏业壁垒,实现外部盈利。
总之,地理编码是⼀个已达到技术瓶颈、且市场空间有限的领域。
参考资料:
1.什么是地理编码—BY ARCGIS
2.地理信息系统导论—BY 张康聪
3.地理编码系统设计与实现
4.⾃然语⾔处理的形式模型—BY 冯志伟(教育部语⾔⽂字应⽤研究所研究员),2010年,中国科学技术⼤学出版社
5. 中⽂⽂本⾃动分词和标注—BY 刘开瑛,商务印书馆,2000年

本文发布于:2023-05-13 22:48:37,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/98614.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:编码   地理   地址   数据   环节
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图