人机编队《NLP中人工智能决策的解释效用评价》49页长综述 - 专知VIP

会员服务 ·

2

AI与军事 · 自然语言处理 · 智能决策 · 可解释性 · 人机编队 ·

人机编队《NLP中人工智能决策的解释效用评价》49页长综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

可解释性是一个虚假的承诺吗？这场争论的起因是，没有足够的证据表明，解释可以帮助人们应对各种情况。要解决这个问题，需要对解释进行更多以人为本、以应用为基础的评估。然而，由于在 NLP 中没有此类研究的既定准则，习惯于标准化代理评估的研究人员必须在研究中为人类-人工智能团队找到合适的测量方法、任务、数据集和合理的模型。为此，首先回顾了适用于基于应用的评估的现有指标。然后，建立了选择合适数据集的标准，并利用这些标准发现，在 50 多个可用于 NLP 可解释性研究的数据集中，只有 4 个符合这些标准。然后，证明了重新评估组建和研究人类-人工智能团队的技术现状的重要性：在某些任务中，将人与模型组成团队可能现在才开始有意义，而对于其他任务，这仍然是不靠谱的。最后，介绍了针对已确定任务之一——验证合同中法律索赔的正确性——进行的人类-人工智能决策示例研究。研究结果表明，提供人工智能预测，无论有无解释，都不会加快决策者的工作速度，同时也不会影响工作效率。主张重新审视人类-人工智能团队的设置，并改进自动将实例推迟给人工智能的做法，在这种情况下，解释可以发挥有益的作用。

成为VIP会员查看完整内容

6

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

27+阅读 · 2024年7月27日

《美国防部人工智能功能的数据验证和认证》2024最新25页slides

《美国防部人工智能功能的数据验证和认证》2024最新25页slides

专知会员服务

31+阅读 · 2024年5月23日

《自主机器人集群的实际考虑和应用》200页

《自主机器人集群的实际考虑和应用》200页

专知会员服务

49+阅读 · 2024年5月5日

《动态数据融合中的可靠推理》美空军研究实验室23页报告

《动态数据融合中的可靠推理》美空军研究实验室23页报告

专知会员服务

65+阅读 · 2023年3月31日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

28+阅读 · 2023年3月25日

《多智能体马尔可夫决策过程：问题和算法的分类》47页长综述

《多智能体马尔可夫决策过程：问题和算法的分类》47页长综述

专知会员服务

41+阅读 · 2023年3月13日

美海军《表征军事领域的新奇性》开发和评估对新事物具有鲁棒性的智能体；DARPA人工智能科学和开放世界新事物学习（SAIL-ON）项目

美海军《表征军事领域的新奇性》开发和评估对新事物具有鲁棒性的智能体；DARPA人工智能科学和开放世界新事物学习（SAIL-ON）项目

专知会员服务

28+阅读 · 2023年3月1日

《高超音速飞行器性能和运行建模：使用多保真度降阶建模方法》北约科技组织22页报告

《高超音速飞行器性能和运行建模：使用多保真度降阶建模方法》北约科技组织22页报告

专知会员服务

30+阅读 · 2023年2月26日

【人机协作】《信任和人类-自主性协作》2022美国陆军128页论文

【人机协作】《信任和人类-自主性协作》2022美国陆军128页论文

专知会员服务

47+阅读 · 2023年1月2日

《人机智能联合行动的交互式OODA过程》18页报告，美国太平洋西北国家实验室

《人机智能联合行动的交互式OODA过程》18页报告，美国太平洋西北国家实验室

专知会员服务

89+阅读 · 2022年12月1日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

51+阅读 · 2023年4月5日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

47+阅读 · 2022年9月25日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

31+阅读 · 2022年7月26日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

27+阅读 · 2022年7月7日

时空数据挖掘:综述

时空数据挖掘:综述

专知

24+阅读 · 2022年6月30日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

23+阅读 · 2020年10月14日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

45+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

33+阅读 · 2020年5月2日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

语义Web知识库补全关键技术研究

国家自然科学基金

12+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

37+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

38+阅读 · 2015年12月31日

基于行为数据的设计知识提取及表达方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

43+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

160+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

92+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

185+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

418+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

58+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

68+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

21+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

VIP会员

相关主题

自然语言处理

相关VIP内容

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

27+阅读 · 2024年7月27日

《美国防部人工智能功能的数据验证和认证》2024最新25页slides

《美国防部人工智能功能的数据验证和认证》2024最新25页slides

专知会员服务

31+阅读 · 2024年5月23日

《自主机器人集群的实际考虑和应用》200页

《自主机器人集群的实际考虑和应用》200页

专知会员服务

49+阅读 · 2024年5月5日

《动态数据融合中的可靠推理》美空军研究实验室23页报告

《动态数据融合中的可靠推理》美空军研究实验室23页报告

专知会员服务

65+阅读 · 2023年3月31日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

28+阅读 · 2023年3月25日

《多智能体马尔可夫决策过程：问题和算法的分类》47页长综述

《多智能体马尔可夫决策过程：问题和算法的分类》47页长综述

专知会员服务

41+阅读 · 2023年3月13日

美海军《表征军事领域的新奇性》开发和评估对新事物具有鲁棒性的智能体；DARPA人工智能科学和开放世界新事物学习（SAIL-ON）项目

美海军《表征军事领域的新奇性》开发和评估对新事物具有鲁棒性的智能体；DARPA人工智能科学和开放世界新事物学习（SAIL-ON）项目

专知会员服务

28+阅读 · 2023年3月1日

《高超音速飞行器性能和运行建模：使用多保真度降阶建模方法》北约科技组织22页报告

《高超音速飞行器性能和运行建模：使用多保真度降阶建模方法》北约科技组织22页报告

专知会员服务

30+阅读 · 2023年2月26日

【人机协作】《信任和人类-自主性协作》2022美国陆军128页论文

【人机协作】《信任和人类-自主性协作》2022美国陆军128页论文

专知会员服务

47+阅读 · 2023年1月2日

《人机智能联合行动的交互式OODA过程》18页报告，美国太平洋西北国家实验室

《人机智能联合行动的交互式OODA过程》18页报告，美国太平洋西北国家实验室

专知会员服务

89+阅读 · 2022年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

综合算力评价研究报告（2024年）

LargeAD：面向自动驾驶的大规模跨传感器数据预训练

大语言模型在C2组织领域的应用分析

生成式推荐最新进展

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

51+阅读 · 2023年4月5日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

47+阅读 · 2022年9月25日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

31+阅读 · 2022年7月26日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

27+阅读 · 2022年7月7日

时空数据挖掘:综述

时空数据挖掘:综述

专知

24+阅读 · 2022年6月30日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

23+阅读 · 2020年10月14日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

45+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

33+阅读 · 2020年5月2日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

12+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

37+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

38+阅读 · 2015年12月31日

基于行为数据的设计知识提取及表达方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

43+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

160+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

92+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

185+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

418+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

58+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

68+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

21+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

微信扫码咨询专知VIP会员