项目名称: 基于三元组可比语料库的语言自动剖析技术应用研究

项目编号: No.61172102

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 电子学与信息系统

项目作者: 肖健

作者单位: 中国电子信息产业发展研究院

项目金额: 63万元

中文摘要: 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到系统的性能。本项目的目标是,采用可比语料库和语言自动剖析技术,使用统计、规则和语义相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库进行统计分析研究;在此基础上,利用n-元词串、关键词簇和语义多词表达等自动抽取技术挖掘本族语言模型,实现改进和发展机器翻译等自然语言处理应用。利用带有本族英语专家修订标记的大规模翻译文本库,通过比较分析工具构建满足可比语料库取样框架要求的三元组可比语料库是本项目的特色。利用本项目算法提取的本族语言模型,将通过我院现有机器翻译系统的运行,测试和评估项目成果的有效性和实用性。项目前期,我院与英国Lancaster大学关于三元组可比语料库自动剖析的示范研究成果为本项目实施奠定了基础。

中文关键词: 三元组可比语料库;语义多词表达;自动语言剖析;关键词簇;

英文摘要:

英文关键词: 3-tuple comparable corpora;semantic multi-word expressions;automantic language profiling;key cluster;

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
开放领域知识图谱问答研究综述
专知会员服务
61+阅读 · 2021年10月30日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
36+阅读 · 2021年2月22日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
194+阅读 · 2020年10月14日
OpenKG开源系列 | 轻量级知识图谱抽取开源工具OpenUE
开放知识图谱
8+阅读 · 2021年11月1日
领域应用 | 知识图谱在滴滴的应用 (CCKS 2019)
开放知识图谱
35+阅读 · 2019年9月3日
300页文本知识提取与推断最新教程
机器学习算法与Python学习
13+阅读 · 2018年8月28日
论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题
开放知识图谱
25+阅读 · 2018年6月26日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
2+阅读 · 2022年4月17日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
开放领域知识图谱问答研究综述
专知会员服务
61+阅读 · 2021年10月30日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
36+阅读 · 2021年2月22日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
194+阅读 · 2020年10月14日
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员