计算机硬件的水平的快速发展以及大数据时代的到来,让沉寂已久的人工神经网络终于有了用武之地,并带动了一波深度学习的热潮。近年来人工智能在自然语言处理、计算机视觉以及围棋领域取得的突破,某些程度上都是得益于深度学习理论的迅猛发展。随着计算机速度的进一步提升和数据资源的丰富,是否意味着深度学习一统天下的时代终将到来?
在清华大学教授朱军看来,“深度学习不是万能的。它虽然在特定任务上取得了显著性能提升,但仍然面临很多挑战。随着应用范围的扩大,纯粹的深度学习不擅长解决的问题会越来越突出。”
传统的深度学习利用感知机构建复杂的人工神经网络,并通过输入海量经过标注的训练样本,通过梯度下降等方法确定唯一的模型参数。在朱军看来,这样的过程至少存在两个问题,首先,它没有办法很好解释样本中那些被模型误分类的数据;其次,深度学习生成的是黑箱模型,可解释性差,在处理未知领域信息和不确定环境时会面临相当大的风险。
“深度学习不是孤立的,它的优点可以与其他机器学习方法共融。”朱军说。朱军和他的团队近年致力于将传统的贝叶斯学习方法与深度学习融合,进行贝叶斯深度学习算法的改进和研究。
贝叶斯方法是传统的机器学习方法之一,它是一个动态的学习过程,最大的特征是引入先验知识,将模型参数看作符合一定概率分布函数的随机变量,并不断根据最新输入的样本调整参数的概率分布函数,能够最大程度刻画样本数据中存在的特异度和不确定性。“深度学习和贝叶斯可以看成一个谱的两个极端。基于数据驱动的深度学习需要大量的标注数据来训练网络;而贝叶斯方法通过引入知识,加上小的训练样本也可以达到很好的效果。”朱军说,“事实上,越来越多的人在思考,我们能不能朝中间靠拢一些? ”
朱军指出,在样本数据有限或存在某种缺陷的情况下,贝叶斯深度学习模型还可以构建一个能够刻画数据分布的模型,并使用这个模型产生新的样本,这样就可以利用小样本数据,挖掘数据中的规律,做无监督和半监督学习,这也是让深度学习能够更有作为的发展方向。
朱军认为,深度学习虽然在很多应用上取得显著进展,但在不确定性、不完全信息、小样本等环境下仍面临着很多挑战,贝叶斯方法具有互补的优势。本次的百千万人才创新讲坛,他将详细介绍贝叶斯深度学习的前沿进展,介绍支持贝叶斯深度学习的珠算概率编程库,以及在小样本学习、半监督学习等方面的应用。
朱军,清华大学教授、人工智能研究院院长助理、美国卡内基梅隆大学兼职教授。主要从事机器学习基础理论、高效算法及应用研究,在国际重要期刊与会议发表论文百余篇。获CCF自然科学一等奖、北京市教学成果一等奖、CCF青年科学家奖、中创软件人才奖等,入选国家“万人计划”青年拔尖人才、MIT TR35中国区先锋者以及IEEE Intelligent Systems评选的“AI’s 10 to Watch”。