|
||||||||||||||||||||||||||||||||||||||||||||||||
中国生物多样性在线数据处理平台的构建
生物多样性
2022, 30 (11):
22356-.
DOI: 10.17520/biods.2022356
高质量的生物多样性数据能够为生物多样性的研究与保护提供数据支撑。目前研究人员开发了大量的生物多样性数据处理软件或工具, 包括工作流系统、R语言包、Python语言包和Excel工具等, 但是使用这些软件或工具需要用户安装相应的软件客户端, 并掌握一定的编程语言、软件开发和复杂的Excel公式等知识和技能。为降低用户的学习成本和使用门槛, 本文采用了Browser/Server模式设计技术、Web技术、可视化技术、响应式开发技术、网络爬虫技术、数据处理技术和Solr智能检索技术等, 针对不同维度的生物多样性数据设计和开发了相应的数据处理模块, 构建了中国生物多样性在线数据处理平台(
表2
基于百度地图API技术对地址进行处理的示例
正文中引用本图/表的段落
X表示单词可错/多/少任意一个字母, *表示有n个特定符号在单词中的任意位置。“高容错”指需要比对的物种名称的任意单词与数据字典的名称之间允许有2个字母的差异; “中容错”指需要比对的物种名称的任意单词与数据字典的名称之间允许有1个字母的差异; “低容错”指需要比对的物种名称的任意单词与数据字典的名称之间不允许存在任何差异。“Match”表示需要比对的物种名称与数据字典的名称完全匹配; “Rectify”表示需要比对的物种名称与数据字典的名称之间存在差异, 可参考标准名称进行校正; “Unmatched”表示数据字典里不存在与需要比对的物种名称相同或相似的物种名称。
第一种技术方案实现过程较为简单, 通过调用百度地图地理编码服务API将需要处理的地址信息转换为经纬度, 再调用百度地图全球逆地理编码服务API将转换而来的经纬度进一步转换成为包含省、市、区县、乡镇和街道以及完整地址信息的处理结果, 如对地址信息“云南省西双版纳傣族自治州勐海县西定哈尼族布朗族乡曼皮村民委员会广邦贝山”及其简写进行处理, 其结果如表2所示。
本文的其它图/表
|