项目名称: 一种“统计+结构”机器学习理论与方法研究

项目编号: No.61472423

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 王珏

作者单位: 中国科学院自动化研究所

项目金额: 83万元

中文摘要: 随着大数据时代到来,人们对海量异构数据语义理解的需求日益凸显,机器学习已成为语义理解和知识获取的关键。现有统计机器学习强调排中律而破缺因果律,而符号机器学习强调因果律而破缺排中律,探索一种折衷的理念,形成一套新的机器学习理论,成为当前机器学习研究的热点。本项目旨在提出一种语义概率图模型,从知识表示理论与模型、关键技术、实例验证三方面开展统计+结构机器学习研究。首先,研究统计+结构知识表示理论,提出基于语义三元组与语义概率图模型,为复杂问题表示与求解提供理论与模型基础;其次,研究语义概率图上知识表示与知识簇提炼、深度学习的结构发现、模型参数自适应学习、精确与近似推理关键技术,实现模型的生成与推理;最后,结合承担的京东商城网络交易和物流配送大型网络数据处理任务,验证提出的理论与关键技术。通过上述研究,探索传统的统计机器学习与符号机器学习的契合点,对大数据机器学习理论和应用具有重要意义。

中文关键词: 机器学习;知识表示;知识推理;语义概率图模型;统计+结构

英文摘要: With the arrival of the era of big data, the need for semantic understanding of vast amounts of heterogeneous data has become increasingly prominent, machine learning has become the key technology of semantic understanding and knowledge acquisition. Existing statistical machine learning approaches emphasize the Law of Excluded Middle and break the law of causality, while the symbolic machine learning emphasizes the causality and breaks the Law of Excluded Middle. To explore an idea of compromised, forming a new machine learning theory, is the hot spot in the current machine learning research field. This project aims to propose a kind of semantic probabilistic graphical models, we will do research in Statistics + Structure based machine learning field, knowledge representation theory and models, key technologies, typical examples for verification etc. First, study the Statistics + Structure based knowledge representation theory, and propose a kind of semantics probabilistic graphical model based on semantic triples,as the theoretical basis of complex problem representation and solution. Secondly, study the following key technologies for model generation and reasoning: knowledge representation and knowledge cluster refining,structure learning based Deep Learning, adaptive learning of model parameters, accurate and approximate inference etc. Finally, combined with the JingDong E-commerce trading record and and logistics and distribution data processing task, verify the proposed theories and key technologies. Through these researches above, to explore the meeting point of traditional Statistical Machine Learning and Symbolic Machine Learning, has great significance to satisfy the needs of big data Machine Learning Theory and application developments.

英文关键词: Machine learning;Knowledge representation;Knowledge inference;Semantic probabilistic graphical model;Statistic +Structure

成为VIP会员查看完整内容
1

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【TPAMI2022】双曲深度神经网络研究综述
专知会员服务
65+阅读 · 2021年12月29日
面向任务型的对话系统研究进展
专知会员服务
57+阅读 · 2021年11月17日
专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
48+阅读 · 2021年8月4日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【NeurIPS 2020】近似推断进展,272页ppt
专知会员服务
32+阅读 · 2020年12月11日
专知会员服务
45+阅读 · 2020年11月13日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
「图分类研究」最新2022综述
专知
5+阅读 · 2022年2月13日
面向任务型的对话系统研究进展
专知
0+阅读 · 2021年11月17日
【经典书】数据结构与算法,770页pdf
专知
2+阅读 · 2021年4月15日
【自然语言处理】清华刘知远55页自然语言处理PPT
产业智能官
19+阅读 · 2019年8月23日
300页文本知识提取与推断最新教程
机器学习算法与Python学习
13+阅读 · 2018年8月28日
贝叶斯机器学习前沿进展
架构文摘
13+阅读 · 2018年2月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
15+阅读 · 2019年6月25日
Knowledge Representation Learning: A Quantitative Review
小贴士
相关VIP内容
【TPAMI2022】双曲深度神经网络研究综述
专知会员服务
65+阅读 · 2021年12月29日
面向任务型的对话系统研究进展
专知会员服务
57+阅读 · 2021年11月17日
专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
48+阅读 · 2021年8月4日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【NeurIPS 2020】近似推断进展,272页ppt
专知会员服务
32+阅读 · 2020年12月11日
专知会员服务
45+阅读 · 2020年11月13日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
「图分类研究」最新2022综述
专知
5+阅读 · 2022年2月13日
面向任务型的对话系统研究进展
专知
0+阅读 · 2021年11月17日
【经典书】数据结构与算法,770页pdf
专知
2+阅读 · 2021年4月15日
【自然语言处理】清华刘知远55页自然语言处理PPT
产业智能官
19+阅读 · 2019年8月23日
300页文本知识提取与推断最新教程
机器学习算法与Python学习
13+阅读 · 2018年8月28日
贝叶斯机器学习前沿进展
架构文摘
13+阅读 · 2018年2月11日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员