项目名称: 面向大数据的机器学习理论与方法

项目编号: No.61332007

项目类型: 重点项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 朱小燕

作者单位: 清华大学

项目金额: 300万元

中文摘要: 互联网发展带来的海量数据,引领了科技与经济发展新的趋势,提出了新的挑战。大数据具有的噪声大、结构复杂多样、变化快等特点,是传统的观察-假设-检验的科学方法,以及现有基于概率统计的数据驱动理论与方法都难以应对的。亟需发展一套面向数据密集的新计算理论与方法,才能对大数据进行有效的处理,并从中及时发现有用的信息。为探讨这样的理论与方法,本项目申请设置了以下3个研究内容:1)多粒度隐层表示的学习理论与方法,以充分挖掘大数据背后隐含的本质规律与特性;2)大数据环境下自适应学习方法与学习策略,以应对大数据快速多样的变化;3)建立大规模图像内容分析与理解应用平台,以验证基础理论和方法的有效性。本课题通过理论和应用的结合,旨在发展与创立应对大数据复杂环境的机器学习理论与方法,预期在大数据处理多粒度隐层表示特征学习、自适应学习等方面取得关键技术的突破,实现海量图像和视频智能处理、信息服务原型系统平台。

中文关键词: 机器学习;粒度;深度学习;自适应学习;抽象知识

英文摘要: With the fast growth of Internet, Big Data is becoming a new trend in the frontier of the technology and economic development and has raised new challenges for scientists. Because of its high noise, great structure variety, and fast evolving velocity, Big Data is hard to be handled using either the traditional methods that follow the 'observation-hypothesis-testing'-type paradigm of scientific research or the existing data-driven methods with a base on the solid probability and statistic theories. Therefore, in order to effectively analyze Big Data and timely discover the underlying useful information, it is imperative to develop a new set of machine learning theories and methods that can meet the requirements of data intensive analysis tasks. To systematically investigate and build such a set of theories and methods, this project proposes to carry out the following three themes of work: 1) develop new theories and computational methods for learning hierarchical latent representations to reveal the essential properties and patterns underlying Big Data; 2) develop machine learning algorithms and strategies that automatically adapt according to the fast and diverse changes of Big Data; and 3) apply the new learning theories and algorithms to image content analysis and understanding and develop a prototype platform to demonstrate and prove their effectiveness. With a systematical investigation and combination between theories and practical applications, this project aims to develop a new set of machine learning theories and algorithms that can deal with Big Data effectively. With the accomplishments of this project, we expect to make breakthrough contributions on some key technologies of hierarchical latent representation learning and adaptive learning in the Big Data environment, and develop a prototype platform for intelligent image and video content analysis and to provide information service.

英文关键词: machine learning;granularity;deep learning;adaptive learning;abstract knowledge

成为VIP会员查看完整内容
4

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
面向语义搜索的自然语言处理
专知会员服务
60+阅读 · 2021年12月18日
专知会员服务
66+阅读 · 2021年7月18日
专知会员服务
124+阅读 · 2021年6月19日
专知会员服务
36+阅读 · 2021年2月20日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
68+阅读 · 2021年2月7日
面向大数据领域的事理认知图谱构建与推断分析
专知会员服务
104+阅读 · 2020年8月11日
【2020新书】单机搞AI、数据科学和物联网,323页pdf
专知会员服务
52+阅读 · 2020年7月20日
专知会员服务
125+阅读 · 2020年3月26日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
96+阅读 · 2019年12月4日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
大数据时代的地学知识图谱研究展望
专知
0+阅读 · 2021年11月25日
会议交流 | 世界人工智能大会“大数据关联”论坛举行
开放知识图谱
0+阅读 · 2021年7月13日
支持个性化学习的行为大数据可视化研究
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
深度学习学习合集
计算机视觉战队
12+阅读 · 2017年12月12日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Arxiv
26+阅读 · 2019年3月5日
小贴士
相关VIP内容
面向语义搜索的自然语言处理
专知会员服务
60+阅读 · 2021年12月18日
专知会员服务
66+阅读 · 2021年7月18日
专知会员服务
124+阅读 · 2021年6月19日
专知会员服务
36+阅读 · 2021年2月20日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
68+阅读 · 2021年2月7日
面向大数据领域的事理认知图谱构建与推断分析
专知会员服务
104+阅读 · 2020年8月11日
【2020新书】单机搞AI、数据科学和物联网,323页pdf
专知会员服务
52+阅读 · 2020年7月20日
专知会员服务
125+阅读 · 2020年3月26日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
96+阅读 · 2019年12月4日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
相关资讯
大数据时代的地学知识图谱研究展望
专知
0+阅读 · 2021年11月25日
会议交流 | 世界人工智能大会“大数据关联”论坛举行
开放知识图谱
0+阅读 · 2021年7月13日
支持个性化学习的行为大数据可视化研究
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
深度学习学习合集
计算机视觉战队
12+阅读 · 2017年12月12日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员