基于深度神经网络的机器学习方法已经取得了长足的进步,并在许多具有挑战性的应用领域中表现出最先进的水平,包括计算机视觉、自然语言处理、语音识别和强化学习等等。这些结果通常是通过使用非常深入的神经网络训练的大型标记数据集获得的,这些网络以分层的方式学习原始数据特征的高度非线性抽象。此外,这些方法经常通过神经结构设计的方式纳入归纳偏见,以限制可能的解决方案的集合。例如,卷积神经网络(CNN)广泛使用具有小感受野的卷积,在一定程度上模仿灵长类动物视觉系统的神经结构。事实上,已经证明,通过CNN学习的表征与从灵长类视觉系统学习的表征相比更有优势。由于这些成功,神经网络方法常常被视为在这些领域建立模型时的事实上的方法。

即使在多个应用领域取得了这些进展,神经网络方法应用于表格数据的可行性仍有一些不确定性。表格数据包括以(行,列)表格式存储的数据,其中行包含独立的实例,列包含不同的特征。此外,表中的每一列/特征可能有不同的可能数据类型(例如,二进制与连续与分类),代表了一种高度异质的数据格式。麦肯锡公司最近的一项研究,调查了19个不同行业的400多个应用领域,显示这种类型的表格数据是工业中最常用的数据格式之一。在表格数据上建立机器学习分类模型的标准方法一般是以决策树(DTs)的形式出现,这是一个有监督的机器学习模型系列,它建立了一个树状图,节点代表我们挑选特征子集的地方,并根据这些特征提出决策规则/阈值(例如。如果性别=男性和年龄>40岁,对于一个包含性别和年龄特征的表格数据集);边代表这个决策规则的结果;叶子代表输出,可以是另一个具有另一组输入特征的决策节点,也可以是预测的感兴趣的类别标签。

基于DT的方法有很多好处,包括它们的基本形式具有很强的可解释性(例如,通过跟踪决策节点的层次流),这在许多现实世界的应用中是一个重要的关注点,而且它们的训练计算速度很快。然而,DT方法也有几个缺点:1)它们容易过度拟合,导致泛化效果差;2)它们对输入数据的微小扰动非常敏感(在不同的数据子集上训练时,可能会学到非常不同的树);3)它们很难对非常复杂、高度非线性的决策规则建模。这些缺点开启了使用神经网络方法的可能性,因为它们有能力对高度非线性关系进行建模,并且对输入数据的微小偏差具有更好的鲁棒性,这一点在其他几个应用领域中得到了证明。然而,由于之前提出的神经网络架构并不适合于表格数据,缺乏适当的归纳偏差往往导致它们无法为表格数据找到最佳解决方案。

在过去的几年里,人们对构建用于表格数据的神经网络方法的兴趣越来越浓厚。特别是,最近的一项研究比较了几种不同的神经网络架构和基于DT的方法,发现在对40个不同的表格式数据集进行评估时,神经网络方法与基于DT的方法具有竞争力,这些数据集具有不同数量的实例(690-418,000)和特征(5-2000)。在许多情况下,这些神经网络方法的表现超过了基于DT的方法,这表明现在有可行的神经网络方法可以应用于表格数据。

在这份报告中,我们描述了我们对表格神经网络方法进行评估的初步结果,该方法使用可穿戴生理传感器技术,如心电图(ECG)和皮肤电化学反应(GSR)进行人类情感状态分类(如压力、唤醒)。情感状态分类是人机交互(HCI)界日益关注的领域,因为模拟和预测人类情感状态的能力开辟了新的研究方向,侧重于改善人类与自主智能系统的互动和团队。

情感状态分类的最大挑战之一是跨个体的稳健表现,在这个领域之前没有多少工作。然而,在这一领域,由于需要进行人体测试,以及个体间潜在的情感状态存在很大程度的变异,所以很难收集大量的标记数据集。我们假设,在低标签数据制度下,对预先提取的特征进行训练的表格神经网络方法可能是一种可行的替代方法,可以完全替代传统上需要大量标签数据集才能有效训练的深度神经网络的端到端训练(即没有任何先验的特征处理)。为了测试这一假设,我们使用了模型框架AutoGluon-Tabular,它是一个易于使用且高度准确的Python库,用于构建表格数据的神经网络。本报告总结了我们使用三个公开可用数据集的发现。认知负荷、情感和压力 认知负荷、情感和压力(CLAS)、ASCERTAIN和AMIGOS。 我们最初的分析集中在这三个数据集内部和之间的主体间分类,因为这仍然是情感状态分类的关键挑战之一。

成为VIP会员查看完整内容
31

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《无人机蜂群》美陆军54页技术报告
专知会员服务
240+阅读 · 2023年1月27日
最新《可解释机器学习》报告,164页ppt建模阐述XAI进展
专知会员服务
107+阅读 · 2022年8月25日
持续学习最新综述论文,29页pdf
专知会员服务
117+阅读 · 2021年4月22日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年2月3日
Arxiv
0+阅读 · 2023年2月2日
Arxiv
37+阅读 · 2021年2月10日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员