Facebook 交互式神经网络可视化系统,应对海量数据和复杂模型

2017 年 4 月 14 日 新智元

  新智元编译  

来源: nextplatform.com

作者:Nicole Hemsoth

翻译:熊笑


【新智元导读】神经网络模型的可视化是解决其黑箱问题的一个解决方案,但用于神经网络可视化的大多数工具集中在图像数据集上,这激发了 Facebook 和 Georgia Tech 一道开发了一款称为 ActiVis 的开发工具的研究,这是一个用于解释大规模神经网络模型和结果的交互式可视化系统。ActiVis 将用户指定的实例或实例子集如何激活神经元进行可视化,以帮助用户了解模型如何生成其预测。用户可以自由地定义具有原始数据属性、变换特征和输出结果的子集,从多个角度实现模型检查。



关于神经网络的“黑箱”问题已经有很多讨论了。复杂的模型在预测性任务中表现良好,但如果想要回溯系统是如何得出结果的,就缺少明确的方法来了解哪里对了或者哪里出错了,也不知道模型是如何得出结论的。


对于老式的机器学习模型来说,这还算不上是个问题,但现在的机器学习模型都是非线性隐藏数据结构,还有数不清的参数,这个问题就凸显出来了。在神经网络部署的研究者看来,黑箱可重现性的缺乏代表着验证障碍,而对于深度学习框架的开发者来说,问题还不止于此。无法观测神经网络的内部运作,会造成模型在性能、效率和准确性上的优化困难。


一个解决方案是神经网络模型的可视化,社交媒体巨头 Facebook 与 Georgia Tech 的研究人员正聚焦于这一方案。Facebook的深度学习用例并不限于图像分析,这意味着不同的数据类型被馈送到了模型中。不幸的是,用于神经网络可视化的大多数工具集中在图像数据集上,这激发了 Facebook 一款称为 ActiVis 的开发工具的研究,这是一个用于解释大规模神经网络模型和结果的交互式可视化系统。


Georgia Tech 团队一年多以前开始与 Facebook 工程师合作,了解他们的分析平台以及可视化工具的适用条件。创建这样一个工具,除了关键技术的挑战之外,它还必须能够“灵活且可泛化到各种各样的模型和数据集,像 Facebook 这样的公司会在许多产品和服务中使用这些模型和数据集,且能够网格化到 Facebook 现有的机器学习平台之中。


该平台由几种不同的机器学习元素组成。Facebook 统一的 ML 平台的核心是 FBLearnerFlow,可以协调不同的机器学习工作流。Flow 的目标是让他们的开发人员在不编写代码的情况下训练模型并查看结果。



ActiVis 对可视化以及多个实例和子集的比较的解释策略都支持。它统一了实例和基于子集的检查,并将复杂模型和本地化检测进行了紧密的整合,且能放大到多样的工业规模的数据集和模型。这对于希望将现有模型用于数据,而又不想被实施阶段的各种麻烦困扰的人来说,是 Facebook 里面一个非常宝贵的工具。ActiVis 特别关注 FBLearner Flow 可视化,部分原因在于用户群。

 

“ActiVis 将用户指定的实例或实例子集如何激活神经元进行可视化,以帮助用户了解模型如何生成其预测。用户可以自由地定义具有原始数据属性、变换特征和输出结果的子集,从多个角度实现模型检查。”

 

Georgia Tech 团队表示,对于任何一个设计这样规模的可视化系统的人来说,有几个因素可以为神经网络虚拟化分析创造一个坚实的平台。他们指向了输入源和数据格式的多样性,高数据量,复杂的模型架构——等等等等,在技术上特别应对了提供不同子集定义和基于实例和分组分析策略的需求。

 

该团队表示,想要使用可视化工具的 Facebook 开发人员添加了几行代码,这些代码说明了 FBLearner Flow 界面中模型的训练过程,它需要生成可视化所需的数据。在训练结束时,该界面提供了一个链接到基于 Web 的工具,以进行可视化和模型考察。


“ActiVis 旨在与 Facebook 上的许多不同的模型和数据集协同工作。”研发团队说,“由于复杂的模型和大型数据集是常用的,因此,ActiVis 具有可扩展性和灵活性,这样工程师就可以轻松地在其模型上使用 ActiVis ,用户则可以对模型视觉化并加以考察,来分析任务。


最后我们要说,其实用可视化神经网络来解决黑箱问题不是什么新鲜事,但随着模型越来越复杂——因为硬件发展和数据变多——对这些工具的需求将更加迫切。在接下来的一年或以后,我们可以期待看到,和包括 TensorFlow、Caffe 和其他关键平台相关的、用于开发和科学计算(都需要结果验证)的可视化工具的开源和商业动作。



原文链接:https://www.nextplatform.com/2017/04/12/look-facebooks-interactive-neural-network-visualization-system/





3月27日,新智元开源·生态AI技术峰会暨新智元2017创业大赛颁奖盛典隆重召开,包括“BAT”在内的中国主流 AI 公司、600多名行业精英齐聚,共同为2017中国人工智能的发展画上了浓墨重彩的一笔。


点击阅读原文,查阅文字版大会实录


访问以下链接,回顾大会盛况:


  • 阿里云栖社区:http://yq.aliyun.com/webinar/play/199

  • 爱奇艺:http://www.iqiyi.com/l_19rrfgal1z.html

  • 腾讯科技:http://v.qq.com/live/p/topic/26417/preview.html


登录查看更多
0

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联
【图神经网络(GNN)结构化数据分析】
专知会员服务
116+阅读 · 2020年3月22日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
77+阅读 · 2020年3月15日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
51+阅读 · 2020年2月19日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
Facebook开源增强版LASER库,包含93种语言工具包
机器之心
5+阅读 · 2019年1月23日
实践 | 如何快速训练免费的文本生成神经网络
黑龙江大学自然语言处理实验室
4+阅读 · 2018年6月4日
神经网络可解释性最新进展
专知
18+阅读 · 2018年3月10日
可视化多维数据的艺术
论智
10+阅读 · 2018年1月23日
【机器学习】基于TensorFlow搭建一套通用机器学习平台
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Knowledge Based Machine Reading Comprehension
Arxiv
4+阅读 · 2018年9月12日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
7+阅读 · 2018年1月31日
Arxiv
5+阅读 · 2017年11月13日
VIP会员
相关资讯
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
Facebook开源增强版LASER库,包含93种语言工具包
机器之心
5+阅读 · 2019年1月23日
实践 | 如何快速训练免费的文本生成神经网络
黑龙江大学自然语言处理实验室
4+阅读 · 2018年6月4日
神经网络可解释性最新进展
专知
18+阅读 · 2018年3月10日
可视化多维数据的艺术
论智
10+阅读 · 2018年1月23日
【机器学习】基于TensorFlow搭建一套通用机器学习平台
Top
微信扫码咨询专知VIP会员