基于三元组可比语料库的语言自动剖析技术应用研究 - 专知基金

会员服务 ·

0

语义多词表达 · 自动语言剖析 · 关键词簇 ·

2011 年 12 月 31 日

基于三元组可比语料库的语言自动剖析技术应用研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于三元组可比语料库的语言自动剖析技术应用研究

项目编号： No.61172102

项目类型： 面上项目

立项/批准年度： 2012

项目学科： 电子学与信息系统

项目作者： 肖健

作者单位： 中国电子信息产业发展研究院

项目金额： 63万元

中文摘要： 由于受到翻译腔的影响，中英平行语料库存在固有的扭斜的语言模型。显然，用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型，严重影响到系统的性能。本项目的目标是，采用可比语料库和语言自动剖析技术，使用统计、规则和语义相结合的方法，对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库进行统计分析研究；在此基础上，利用n-元词串、关键词簇和语义多词表达等自动抽取技术挖掘本族语言模型，实现改进和发展机器翻译等自然语言处理应用。利用带有本族英语专家修订标记的大规模翻译文本库，通过比较分析工具构建满足可比语料库取样框架要求的三元组可比语料库是本项目的特色。利用本项目算法提取的本族语言模型，将通过我院现有机器翻译系统的运行，测试和评估项目成果的有效性和实用性。项目前期，我院与英国Lancaster大学关于三元组可比语料库自动剖析的示范研究成果为本项目实施奠定了基础。

中文关键词： 三元组可比语料库；语义多词表达；自动语言剖析；关键词簇；

英文摘要：

英文关键词： 3-tuple comparable corpora；semantic multi-word expressions；automantic language profiling；key cluster；

成为VIP会员查看完整内容

0

相关内容

语义多词表达

语义多词表达

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

面向语义搜索的自然语言处理

面向语义搜索的自然语言处理

专知会员服务

60+阅读 · 2021年12月18日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

65+阅读 · 2021年10月30日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

27+阅读 · 2020年12月2日

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

专知会员服务

41+阅读 · 2020年11月18日

面向知识图谱的信息抽取

专知会员服务

202+阅读 · 2020年10月14日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

【CLL 2019】汉语复合名词短语语义关系知识库构建与自动识别研究

【CLL 2019】汉语复合名词短语语义关系知识库构建与自动识别研究

专知会员服务

17+阅读 · 2019年10月18日

OpenKG开源系列 | 轻量级知识图谱抽取开源工具OpenUE

OpenKG开源系列 | 轻量级知识图谱抽取开源工具OpenUE

开放知识图谱

8+阅读 · 2021年11月1日

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

AI科技评论

1+阅读 · 2021年10月14日

OpenKG开源系列 | 大规模中文概念图谱OpenConcepts (浙江大学)

OpenKG开源系列 | 大规模中文概念图谱OpenConcepts (浙江大学)

开放知识图谱

1+阅读 · 2021年7月15日

阿里多语言翻译模型的前沿探索及技术实践

阿里多语言翻译模型的前沿探索及技术实践

专知

1+阅读 · 2021年4月8日

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

专知

41+阅读 · 2019年11月2日

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

AI科技评论

10+阅读 · 2019年9月17日

领域应用 | 知识图谱在滴滴的应用 (CCKS 2019)

领域应用 | 知识图谱在滴滴的应用 (CCKS 2019)

开放知识图谱

35+阅读 · 2019年9月3日

GitHub出现一个大型中文NLP资源，宣称要放出亿级语料库

GitHub出现一个大型中文NLP资源，宣称要放出亿级语料库

量子位

26+阅读 · 2019年2月14日

300页文本知识提取与推断最新教程

300页文本知识提取与推断最新教程

机器学习算法与Python学习

13+阅读 · 2018年8月28日

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

开放知识图谱

26+阅读 · 2018年6月26日

面向机器翻译的多词表达语义分析及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

可比语料库质量量化与提升方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉语全文词义标注关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

傣语文本分析与语音合成研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语言理解的机器翻译译文自动评价方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于本体的多策略民汉机器翻译研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

Chinese Idiom Paraphrasing

Arxiv

0+阅读 · 2022年4月20日

Common Message Acknowledgments: Massive ARQ Protocols for Wireless Access

Arxiv

0+阅读 · 2022年4月20日

Risk-Aware Learning for Scalable Voltage Optimization in Distribution Grids

Arxiv

0+阅读 · 2022年4月18日

A Study on Prompt-based Few-Shot Learning Methods for Belief State Tracking in Task-oriented Dialog Systems

Arxiv

0+阅读 · 2022年4月18日

Graph Condensation for Graph Neural Networks

Arxiv

2+阅读 · 2022年4月17日

UAMD-Net: A Unified Adaptive Multimodal Neural Network for Dense Depth Completion

Arxiv

1+阅读 · 2022年4月16日

ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification

ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification

Arxiv

0+阅读 · 2022年4月15日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

KGAT: Knowledge Graph Attention Network for Recommendation

Arxiv

40+阅读 · 2019年5月20日

Constructing Narrative Event Evolutionary Graph for Script Event Prediction

Arxiv

11+阅读 · 2018年5月16日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

语义多词表达

自动语言剖析

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

《多域时代中维持弹性军事训练：挑战与机遇》

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

相关VIP内容

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

面向语义搜索的自然语言处理

面向语义搜索的自然语言处理

专知会员服务

60+阅读 · 2021年12月18日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

65+阅读 · 2021年10月30日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

27+阅读 · 2020年12月2日

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

专知会员服务

41+阅读 · 2020年11月18日

面向知识图谱的信息抽取

专知会员服务

202+阅读 · 2020年10月14日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

【CLL 2019】汉语复合名词短语语义关系知识库构建与自动识别研究

【CLL 2019】汉语复合名词短语语义关系知识库构建与自动识别研究

专知会员服务

17+阅读 · 2019年10月18日

相关资讯

OpenKG开源系列 | 轻量级知识图谱抽取开源工具OpenUE

OpenKG开源系列 | 轻量级知识图谱抽取开源工具OpenUE

开放知识图谱

8+阅读 · 2021年11月1日

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

AI科技评论

1+阅读 · 2021年10月14日

OpenKG开源系列 | 大规模中文概念图谱OpenConcepts (浙江大学)

OpenKG开源系列 | 大规模中文概念图谱OpenConcepts (浙江大学)

开放知识图谱

1+阅读 · 2021年7月15日

阿里多语言翻译模型的前沿探索及技术实践

阿里多语言翻译模型的前沿探索及技术实践

专知

1+阅读 · 2021年4月8日

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

专知

41+阅读 · 2019年11月2日

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

AI科技评论

10+阅读 · 2019年9月17日

领域应用 | 知识图谱在滴滴的应用 (CCKS 2019)

领域应用 | 知识图谱在滴滴的应用 (CCKS 2019)

开放知识图谱

35+阅读 · 2019年9月3日

GitHub出现一个大型中文NLP资源，宣称要放出亿级语料库

GitHub出现一个大型中文NLP资源，宣称要放出亿级语料库

量子位

26+阅读 · 2019年2月14日

300页文本知识提取与推断最新教程

300页文本知识提取与推断最新教程

机器学习算法与Python学习

13+阅读 · 2018年8月28日

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

开放知识图谱

26+阅读 · 2018年6月26日

相关基金

面向机器翻译的多词表达语义分析及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

可比语料库质量量化与提升方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉语全文词义标注关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

傣语文本分析与语音合成研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语言理解的机器翻译译文自动评价方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于本体的多策略民汉机器翻译研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

Chinese Idiom Paraphrasing

Arxiv

0+阅读 · 2022年4月20日

Common Message Acknowledgments: Massive ARQ Protocols for Wireless Access

Arxiv

0+阅读 · 2022年4月20日

Risk-Aware Learning for Scalable Voltage Optimization in Distribution Grids

Arxiv

0+阅读 · 2022年4月18日

A Study on Prompt-based Few-Shot Learning Methods for Belief State Tracking in Task-oriented Dialog Systems

Arxiv

0+阅读 · 2022年4月18日

Graph Condensation for Graph Neural Networks

Arxiv

2+阅读 · 2022年4月17日

UAMD-Net: A Unified Adaptive Multimodal Neural Network for Dense Depth Completion

Arxiv

1+阅读 · 2022年4月16日

ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification

ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification

Arxiv

0+阅读 · 2022年4月15日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

KGAT: Knowledge Graph Attention Network for Recommendation

Arxiv

40+阅读 · 2019年5月20日

Constructing Narrative Event Evolutionary Graph for Script Event Prediction

Arxiv

11+阅读 · 2018年5月16日

微信扫码咨询专知VIP会员