《大型语言模型 (LLM) 对比研究》美海军最新报告 - 专知VIP

会员服务 ·

42

AI与军事 · 大型语言模型 · 美国海军研究生院 ·

2024 年 6 月 28 日

《大型语言模型 (LLM) 对比研究》美海军最新报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在过去几年中，大型语言模型（LLM）的能力迅速提高，OpenAI 的 GPT-4 就是最突出的例子。本案例研究探讨了 GPT-4 用于协助研究任务的两种方式：数据分析和撰写执行摘要。我们之所以选择这些任务，是因为它们在国防分析研究所（IDA）的项目中很常见，而且经常被作为适合大型语言模型的任务提出。首先，使用 GPT-4 完成了数据清理、探索、建模和可视化等任务。将其质量和速度与人类完成相同任务进行了比较。发现单独使用人工智能时，分析质量不够高，但有了人类伙伴后，分析质量大大提高。使用 GPT-4 节省了约 60% 的数据分析任务时间，并为该领域节省大量成本提供了机会。然后，使用 GPT-4 为三份公开的 IDA 出版物生成了执行摘要（EXSUM），并将其与人工生成的执行摘要进行了比较。发现大型语言模型生成的内容提要往往无法为技术性较强的论文提供适当的背景，但考虑到其生成速度和详尽程度，大型语言模型仍然提供了节省时间和成本的机会。

成为VIP会员查看完整内容

83

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《基于生成式人工智能修改和查询 MBSE 模型》美海军最新报告

《基于生成式人工智能修改和查询 MBSE 模型》美海军最新报告

专知会员服务

57+阅读 · 2024年7月1日

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

专知会员服务

50+阅读 · 2024年6月30日

《从情景多模态对话中构建知识图谱》美空军项目报告

《从情景多模态对话中构建知识图谱》美空军项目报告

专知会员服务

55+阅读 · 2024年5月19日

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

专知会员服务

170+阅读 · 2024年1月27日

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

专知会员服务

72+阅读 · 2023年11月28日

《谈判游戏》美海军NPS等最新报告

《谈判游戏》美海军NPS等最新报告

专知会员服务

31+阅读 · 2023年11月13日

《调查和获取攻击者信息的策略 (SIENNA)》美国空军最新81页技术报告

《调查和获取攻击者信息的策略 (SIENNA)》美国空军最新81页技术报告

专知会员服务

31+阅读 · 2023年4月28日

《增强空军转型能力管道的数据赋能方法》美智库2023最新110页报告

《增强空军转型能力管道的数据赋能方法》美智库2023最新110页报告

专知会员服务

42+阅读 · 2023年3月29日

《自适应非奇异终端滑模控制在空间故障平台会合中的应用》美国海军研究实验室2022最新19页报告

《自适应非奇异终端滑模控制在空间故障平台会合中的应用》美国海军研究实验室2022最新19页报告

专知会员服务

14+阅读 · 2022年11月23日

《曲面地球上电子战仿真的算法分析》美国海军研究实验室18页报告

《曲面地球上电子战仿真的算法分析》美国海军研究实验室18页报告

专知会员服务

48+阅读 · 2022年9月29日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

109+阅读 · 2023年4月5日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

25+阅读 · 2022年11月24日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

52+阅读 · 2022年9月25日

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

171+阅读 · 2022年9月19日

《机器人和自主系统-人工智能（RAS-AI）行动计划》澳大利亚皇家海军报告

《机器人和自主系统-人工智能（RAS-AI）行动计划》澳大利亚皇家海军报告

专知

19+阅读 · 2022年9月14日

推荐！《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

60+阅读 · 2022年9月8日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

47+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

62+阅读 · 2022年8月25日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

专知

128+阅读 · 2022年4月2日

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

UXT 在发育中的新功能以及相关作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

大型语言模型

美国海军研究生院

相关VIP内容

《基于生成式人工智能修改和查询 MBSE 模型》美海军最新报告

《基于生成式人工智能修改和查询 MBSE 模型》美海军最新报告

专知会员服务

57+阅读 · 2024年7月1日

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

专知会员服务

50+阅读 · 2024年6月30日

《从情景多模态对话中构建知识图谱》美空军项目报告

《从情景多模态对话中构建知识图谱》美空军项目报告

专知会员服务

55+阅读 · 2024年5月19日

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

专知会员服务

170+阅读 · 2024年1月27日

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

专知会员服务

72+阅读 · 2023年11月28日

《谈判游戏》美海军NPS等最新报告

《谈判游戏》美海军NPS等最新报告

专知会员服务

31+阅读 · 2023年11月13日

《调查和获取攻击者信息的策略 (SIENNA)》美国空军最新81页技术报告

《调查和获取攻击者信息的策略 (SIENNA)》美国空军最新81页技术报告

专知会员服务

31+阅读 · 2023年4月28日

《增强空军转型能力管道的数据赋能方法》美智库2023最新110页报告

《增强空军转型能力管道的数据赋能方法》美智库2023最新110页报告

专知会员服务

42+阅读 · 2023年3月29日

《自适应非奇异终端滑模控制在空间故障平台会合中的应用》美国海军研究实验室2022最新19页报告

《自适应非奇异终端滑模控制在空间故障平台会合中的应用》美国海军研究实验室2022最新19页报告

专知会员服务

14+阅读 · 2022年11月23日

《曲面地球上电子战仿真的算法分析》美国海军研究实验室18页报告

《曲面地球上电子战仿真的算法分析》美国海军研究实验室18页报告

专知会员服务

48+阅读 · 2022年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《“蛛网”行动：乌克兰不对称作战的演进》报告

美国启动“自有军事人工智能计划”：采用谷歌Gemini以推动全军人工智能应用

《解析陆域作战方向：一个概念性框架》报告

《人工智能与人类的未来》2025年最新300页书籍

相关资讯

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

109+阅读 · 2023年4月5日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

25+阅读 · 2022年11月24日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

52+阅读 · 2022年9月25日

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

171+阅读 · 2022年9月19日

《机器人和自主系统-人工智能（RAS-AI）行动计划》澳大利亚皇家海军报告

《机器人和自主系统-人工智能（RAS-AI）行动计划》澳大利亚皇家海军报告

专知

19+阅读 · 2022年9月14日

推荐！《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

60+阅读 · 2022年9月8日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

47+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

62+阅读 · 2022年8月25日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

专知

128+阅读 · 2022年4月2日

相关基金

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

UXT 在发育中的新功能以及相关作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员