项目名称: 面向Web的中文模糊地名自动识别与近似地理范围估算

项目编号: No.41201405

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 地理学

项目作者: 陈旭

作者单位: 武汉大学

项目金额: 25万元

中文摘要: 基于人工方式构建中文地名词典,耗时长、地名数目规模受限,无法满足Web环境下地理信息获取服务对地名的需求。本项目研究面向Web的中文模糊地名自动识别与近似地理范围估算,利用面向地名主题信息的协同聚焦爬取方法,从多源海量Web信息中爬取模糊地名及关联地名网页信息,进一步利用规则与统计相结合的模糊中文地名分级识别策略,有效的提取模糊地名及其关联地名信息,最终基于空间扫描统计的方法完成模糊地名近似地理覆盖范围估算。本项目研究Web环境下地名自动获取的新问题,其成果可应用各类网络空间信息系统,具有重要的理论研究价值与应用前景。

中文关键词: 地名;识别;地理范围;;

英文摘要: Building gazetteer by labour is a hard woking ,which is time-consuming and the scale of gazetteer is limited, that can not satisfy the requirement of geographic information retrieval based on Web. So we research on web-based automatic identifying of a chinese vague toponym and the approximate footprint estimate. We use geographically focused collaborative crawling for acquiring web page with chinese vague toponym and associated place names from mulit-source information.Further, we use a hierarchical strategy which a combination of rules and statistics for identifying chinese vague toponym. Finally, spatial scan statistic-based approach is used to estimate the approximate geographic coverage of chinese vague toponym. This project research on the new problem about the obtaining of toponym based on Web, the results can be applied to various WebGIS application, which has important theoretical value and prospects.

英文关键词: toponym;recognition;geographical coverage;;

成为VIP会员查看完整内容
0

相关内容

顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
开放型对话技术研究综述
专知会员服务
38+阅读 · 2021年12月28日
专知会员服务
68+阅读 · 2021年8月20日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
应用知识图谱的推荐方法与系统
专知会员服务
115+阅读 · 2020年11月23日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
155+阅读 · 2020年4月21日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
开源开放 | 中国近代历史人物知识图谱
开放知识图谱
2+阅读 · 2021年12月3日
基于深度学习的小目标检测方法综述
专知
2+阅读 · 2021年4月29日
最全中文自然语言处理数据集、平台和工具整理
深度学习与NLP
34+阅读 · 2019年6月22日
中文自然语言处理数据集:ChineseNLPCorpus
AINLP
33+阅读 · 2019年6月21日
Kali Linux 渗透测试:密码攻击
计算机与网络安全
16+阅读 · 2019年5月13日
一文读懂命名实体识别
AINLP
31+阅读 · 2019年4月23日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
赛尔原创 | 开放域中文知识图谱《大词林》
哈工大SCIR
71+阅读 · 2018年4月16日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月15日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
小贴士
相关主题
相关VIP内容
顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
开放型对话技术研究综述
专知会员服务
38+阅读 · 2021年12月28日
专知会员服务
68+阅读 · 2021年8月20日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
应用知识图谱的推荐方法与系统
专知会员服务
115+阅读 · 2020年11月23日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
155+阅读 · 2020年4月21日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
相关资讯
开源开放 | 中国近代历史人物知识图谱
开放知识图谱
2+阅读 · 2021年12月3日
基于深度学习的小目标检测方法综述
专知
2+阅读 · 2021年4月29日
最全中文自然语言处理数据集、平台和工具整理
深度学习与NLP
34+阅读 · 2019年6月22日
中文自然语言处理数据集:ChineseNLPCorpus
AINLP
33+阅读 · 2019年6月21日
Kali Linux 渗透测试:密码攻击
计算机与网络安全
16+阅读 · 2019年5月13日
一文读懂命名实体识别
AINLP
31+阅读 · 2019年4月23日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
赛尔原创 | 开放域中文知识图谱《大词林》
哈工大SCIR
71+阅读 · 2018年4月16日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员