针对战场态势信息众多、变化趋势认知困难的问题,提出基于大模型的态势认知智能体框架和智能态势认知推演方法。从认知概念出发,结合智能体的抽象性、具身性特点,明确了智能体构建的3个关键环节:学习环境、记忆方式和产生知识机制;设计了战场态势认知智能体架构,包括记忆部件、规划部件、执行部件、评估部件以及智能体训练要点。在长期记忆部件中,围绕战场复杂状态建模特点,分析大语言模型、多模态大模型、大序列模型的运用问题。态势是现实世界中人们关注的事物状态及可能出 现的变化。 军事领域中,战场态势是指战场环境与兵 力分布的当前状态和发展变化的趋势[1] 。 战场态势感 知是对敌情、我情、战场环境所处状态的感知以及对作 战进程变化的理解,是实施作战指挥决策的基础支撑。 当前,战场态势信息来源分散、复杂高维、实时快变、多 元异构,信息的碎片化、片面化、不确定性问题严重,准 确把握变化的趋势对指挥员或指挥机构也越来越 困难。 针对上述问题,文献[2]通过改进加权平均法及优 化小波变换完成数据与图像融合处理;文献[3]将数据 分析和数据展现技术运用于态势感知,然而当前战场 态势的信息量已经达到海量级别,超出了人类认知极 限,容易导致片面的战场态势感性认知。 文献[4]基于 卷积神经网络提取复杂战场环境特征;文献[5]在战场 态势感知中使用注意力机制,生成围绕作战目的和作 战任务的态势认知;文献[6]探讨将表示学习、深度学 习、强化学习和群体智能等用于态势认知。 最近,人工 智能中的大模型技术发展迅速,一定程度建模了世界 通用知识。 基于大模型的自主智能体[7⁃8] 表现出了较 强的认知环境、适应环境的能力,给战场态势感知带来 了新的启发。 本文提出利用大模型构建态势认知智能体,智能 体在仿真环境下推演学习复杂态势规律,构建从战场 之“态”到预测战场之“势”之间的复杂映射关系知识。 态 势 认 知 智 能 体 与 AIGC ( Artificial Intelligence Generated Content)一样,有望生成多种态势的发展路 径,供使用人员最终决策。

成为VIP会员查看完整内容
105

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900余篇参考文献。该综述文章旨在系统地梳理大语言模型的研究进展与核心技术,讨论了大量的相关工作。自大语言模型综述的预印本上线以来,受到了不少读者的关注。

自英文综述文章上线后,陆续有读者询问是否有对应的中文版本。为此,我们于2023年8月发布了该综述的中文翻译版。为了更好地提供大模型技术的中文参考资料,我们于2023年12月底继续启动了中文书的编写工作,并且于近日完成初稿。与英文综述文章的定位不同,中文版书籍更注重为大模型技术的入门读者提供讲解,为此我们在内容上进行了大幅度的更新与重组,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的技术书籍。

中文书项目链接:

https://llmbook-zh.github.io/

中文书下载链接1:

****https://github.com/LLMBook-zh/LLMBook-zh.github.io/blob/main/LLMBook.pdf

中文书下载链接2:

********http://aibox.ruc.edu.cn/zws/index.htm

全书章节组织:

一、背景与基础知识

第一章 引言(大模型发展历程、重要技术概览) 第二章 基础介绍(Scaling Law、GPT系列模型发展历程) 第三章 大模型资源(开源模型、数据、代码库) 二、预训练

第四章 数据准备(数据收集、清洗、配比、课程方法) 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进) 第六章 模型预训练(预训练任务、优化参数设置、并行训练方法) 三、微调与对齐

第七章 指令微调(指令数据收集与合成方法、指令微调策略与作用) 第八章 人类对齐(3H标准、RLHF算法、非RL算法) 四、大模型使用

第九章 解码与部署(解码生成算法、解码加速算法、模型压缩算法) 第十章 提示学习(基础提示方法、上下文学习、思维链) 第十一章 规划与智能体(复杂规划方法、智能体搭建方法) 五、评测与应用

第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系) 第十三章 应用(概览研究领域与专业领域的应用)

大语言模型发展时间线

LLaMA 系列模型的衍生工作进化图

在本书撰写过程中,我们收到了来自许多同行的大量修改意见,在此一并表示感谢,希望大家一如既往支持与关注我们的大模型中文书,您的支持与反馈将是我们前行最大的动力。本书的初版仅是一个起点,我们计划在网上持续进行内容的更新和完善,并特别欢迎读者提出宝贵的批评与建议,也会同步在网站上对于提出宝贵建议的读者进行致谢。如果您有任何意见、评论以及建议,请通过GitHub的Issue页面(https://github.com/LLMBook-zh/LLMBook-zh.github.io/issues)或邮箱进行反馈。

为了更好地整理和传播大模型技术的最新进展与技术体系,我们为读者提供了以下配套资源,供读者在阅读本书时进行参考和使用。

**大模型代码工具库:**我们开发了一个全面的代码工具库LLMBox,专门用于开发和实现大语言模型,其基于统一化的训练流程和全面的模型评估框架。LLMBox旨在成为训练和利用大语言模型的一站式解决方案,其内部集成了大量实用的功能,实现了训练和利用阶段高度的灵活性和效率。工具库链接:https://github.com/RUCAIBox/LLMBox。

**

**

**YuLan大模型:**YuLan系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型(名字“玉兰”取自中国人民大学校花)。最新版本从头完成了整个预训练过程,并采用课程学习技术基于中英文双语数据进行有监督微调,包括高质量指令和人类偏好数据。模型链接:https://github.com/RUC-GSAI/YuLan-Chat。

**

**

本书各章节的主要负责人和参与人名单如下:

第三章的负责人是闵映乾和杨晨,参与人有李军毅、周昆; * 第四章的负责人是张君杰、侯宇蓬和周昆; * 第五章的负责人是董梓灿,参与人有田震和唐天一; * 第六章的负责人是唐天一和陈昱硕; * 第七章的负责人是唐天一,参与人有成晓雪; * 第八章的负责人是李军毅和陈志朋; * 第九章的负责人是陈昱硕、刘沛羽和唐天一,参与人有周昆; * 第十章的负责人是李军毅、汤昕宇和都一凡; * 第十一章的负责人是任瑞阳和蒋锦昊,参与人有李军毅; * 第十二章的负责人是张北辰和周昆,参与人有张高玮; * 第十三章的负责人是周昆,参与人(按拼音字母排序)有蒋锦昊、李依凡、刘子康、孙文奇、王禹淏、徐澜玲、杨锦霞和郑博文。

同时感谢其他所有参与本书编写、校对的同学和老师们。

成为VIP会员查看完整内容
119

3月28日消息,腾讯研究院发布了《工业大模型应用报告》,报告指出,工业正处于从数字化向智能化迈进的阶段,而大模型凭借其卓越的理解能力、生成能力和泛化能力,成为推动工业智能化的关键力量,有望拓展人工智能和工业融合的新空间。该报告在中国通信工业协会的指导和支持下,由腾讯研究院与中国通信工业协会物联网应用分会、毕马威企业咨询(中国)有限公司以及腾讯云智慧行业五部共同撰写。报告深入剖析了工业大模型的三种构建模式和应用场景,并分析了工业大模型在促进工业智能化发展方面的机遇与挑战。报告全文如下

成为VIP会员查看完整内容
83

来源:弗若斯特沙利文 日前,面对相继上市的众多模型,国际知名调研机构弗若斯特沙利文(Frost&Sullivan)联合头豹研究院发布《2024年中国大模型能力评测报告》(以下简称“报告”)。

  报告选定了中外19个具有代表性的大模型进行评测,其中覆盖15家国内主流模型,与此同时,国际方面选择了OpenAI的GPT3.5和GPT4、谷歌的Gemini1.0以及Anthropic的Claude2,并将这四大模型的平均水平设为国际大模型均线。   报告以五大细分维度——数理科学、语言能力、道德责任、行业能力及综合能力为衡量标准,深入探索了大模型的能力边界,为社会各界提供了对当前中国大模型产业发展现状的清晰认知,以及大模型技术发展的潜力和在实际应用中的价值体现。

  报告的核心内容包括以下几个方面:

  具体内容如下

成为VIP会员查看完整内容
83

随着深度学习和自然语言处理技术的进步, 大语言模型(Large language models, LLMs)展现出巨大潜力. 尽管如此, 它们在处理复杂任务时仍存在局限性, 特别是在任务需要结合规划及外部工具调用的场合. 面向这一挑战, 提出国内首个以军事游戏为背景的中文的复杂任务规划与执行数据集(Complex task planning and execution dataset, CTPaE), 以及一个基于LLMs的自主复杂任务规划 (Complex task planning, CTP) 处理框架AutoPlan. 该框架可以对复杂任务进行自主规划得到元任务序列, 并使用递进式ReAct提示 (Progressive ReAct prompting,PRP) 方法对已规划的元任务逐步执行. 该框架的有效性通过在CTPaE数据集上的实验及与其他经典算法的比较分析得到了验证. 项目地址: https://github.com/LDLINGLINGLING/AutoPlan.

大语言模型(Large language models, LLMs)凭借其丰富的知识储备和强大的推理能力, 在自然语言理解和交互式知识查询等任务展现出令人瞩目的效果[1]. 然而, 大模型常面临幻觉输出、知识更新滞后以及领域知识理解不足等问题, 这些挑战影响了其在信息真实性、时效性和逻辑一致性等方面的可靠性[2]. 随着上下文学习(In-context learning)[3]、思维链(Chain-of-thoughts)[4]以及外部资源注入[5]等方法的应用, 大模型在逻辑推理和复杂任务分析方面取得了巨大进步[2]. 工具接口的调用是大模型的典型推理应用之一, 典型的应用包括网络搜索[6]、计算器调用[7]、数据库查询[8]以及数学问题求解[9]等. 这些应用可以弥补大模型在特定领域任务上的不足, 释放其在解决复杂任务上的潜力, 使系统更精准地理解和执行用户输入, 实现用户与系统之间更加自然、便捷的交互, 在中台调度[10-11]、具身智能[12]、军事模拟仿真[13]和平行智能[14]等领域具有广阔的应用前景.

为了指导大模型有效利用这些工具接口, 当前的研究通过在上下文中加入工具使用的示例来引导大模型[15], 或者进行微调来优化大模型在工具使用上的性能[7, 16]. 例如, Toolformer[7]采用自监督的方式来微调大模型, 使其能够获得调用API的能力, 在单步工具接口调用任务上取得了突破. 但实际应用往往需要进行连续多步工具调用, 例如在指挥控制场景中, 计算与目标位置的距离这一基础任务涉及到三个步骤, 即, 1)获取当前自身的位置; 2)获取目标的位置; 3)计算两个坐标之间的距离. 虽然详细的指令能更好地引导模型实现任务目标, 但人类往往倾向于提供粗粒度、高层次的指令. 在实际情况中, 指挥员通常会直接下达计算距离的命令, 而不会给出具体步骤, 这就需要大模型在理解上下文并且对该任务进行规划后, 调用相应的接口来执行. ToolLLM[17]使用深度优先搜索策略, 边规划边执行指令. TPTU[8]提出基于任务规划和工具调用的分步处理思路, 提升模型应对复杂任务的能力. 然而, 现有的模型在这种高层次指令的任务规划过程中, 经常出现中间步骤缺失、重复、突然中断等不连贯的问题, 主要原因在于: 1)由于工具类型和应用领域等差异, 现有的大模型仅靠提示学习或者思维链方法直接推理输出结果难以有效地泛化到新的工具、任务以及应用领域; 2)具备单步工具调用和执行能力的模型在多步调用的过程中, 存在中途模型遗忘或混淆当前应执行的任务以及无法对历史的运算结果进行整合输出最终答案的问题.

为解决上述问题, 本文提出基于大语言模型的复杂任务自主规划处理框架AutoPlan, 整体框架如图1所示. 具体来说, AutoPlan将一个复杂任务分成两个阶段, 先通过一个复杂任务规划(Complex task planning, CTP)模型对复杂任务进行规划, 得到一个元任务序列. 然后再利用递进式ReAct提示(Progressive ReAct prompting, PRP)模型执行元任务序列, 并输出最终结果, 从而实现对复杂指令的自主规划处理. 为验证上述方法的可行性, 本文构建全新的复杂任务规划与执行数据集(Complex task planning and execution dataset, CTPaE), 旨在为复杂任务规划与执行研究提供一个测试基准, 填补该领域的研究空白. CTPaE的构建经历模板构建、自动拆解和人工评估三个步骤, 以军事战略游戏为背景, 具备多样的任务类型和工具种类. 总结来看, 本文的主要贡献在于: 1) 提出全新的复杂任务规划与执行数据集; 2) 提出基于大模型的自动规划和工具调用框架AutoPlan, 利用先进行任务规划后执行的思路, 并且设计CTP模型和PRP模型来有效解决复杂任务带来的挑战; 3) 与多个经典算法进行对比实验, 结果证明了CTPaE的挑战性以及本文提出方法的有效性. 此外, AutoPlan框架还具有广泛的应用前景, 例如在平行智能[18]场景中, AutoPlan可以赋能数字人使其具备独立解决问题的能力以及赋能机器人来协助人类完成各类任务, 执行人机交互、任务协调和计算实验等功能, 显著扩展了原始解决方案的能力范围[19]. 此外, 将AutoPlan框架与去中心化自治组织(Decentralized autonomous organizations and decentralized autonomous operations, DAOs)[20]相结合, 可以实现框架的去中心化、自主化、组织化和有序化, 极大地提高人机协作效率以及任务完成质量.

成为VIP会员查看完整内容
77

目前大模型能力仍处于Emerging AGI水平,就模型成熟度而言,语言大模型>多模态大模型>具身智能大模型。根据DeepMind的定义,AGI应能够广泛学习、执行复杂多步骤的任务。模型的AGI水平可分为Level-0至Level-5共6个等级,现阶段大模型在处理任务的广泛性上还有很大提升空间,即使是国际顶尖的大模型也仍处于Level-1 Emerging AGI阶段。不同类型大模型成熟度差异较大,目前大语言模型能力相对完善,落地应用场景丰富,底层技术路线较为成熟;多模态大模型已经能够面向B\C端推出商业化产品,但细节优化空间较大;具身智能类大模型还在探索阶段,技术路线尚不清晰。

成为VIP会员查看完整内容
72

欢迎阅读第七版AI指数报告。2024年的指数是我们迄今为止最全面的一版,它发布于一个AI对社会影响前所未有的重要时刻。今年,我们扩大了研究范围,更广泛地覆盖了诸如AI技术进步、公众对技术的看法以及围绕其发展的地缘政治动态等基本趋势。本版报告提供了比以往任何时候都多的原始数据,引入了关于AI培训成本的新估计,对负责任的AI环境进行了详细分析,并全新增加了一个章节,专门讨论AI对科学和医学的影响。 AI指数报告跟踪、汇总、提炼并可视化与人工智能(AI)相关的数据。我们的使命是提供公正、经过严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众能够更全面、更细致地理解AI这一复杂领域。

AI在某些任务上超越了人类,但并非在所有任务上。AI已在包括图像分类、视觉推理和英语理解等多个基准测试中超越人类表现。然而,在更复杂的任务,如竞赛级数学、视觉常识推理和规划方面,它仍然落后。

行业继续主导前沿AI研究。2023年,工业界产出了51个显著的机器学习模型,而学术界仅贡献了15个。2023年,由工业界和学术界合作的显著模型也达到了21个,创历史新高。

前沿模型变得更加昂贵。根据AI指数的估计,最先进的AI模型的训练成本已达到前所未有的水平。例如,OpenAI的GPT-4训练估计耗资7800万美元,而Google的Gemini Ultra的计算成本为1.91亿美元。

美国领先中国、欧盟和英国,成为顶尖AI模型的主要来源。2023年,来自美国机构的显著AI模型有61个,远超欧盟的21个和中国的15个。

对于LLM责任的稳健和标准化评估严重缺乏。AI指数的新研究显示,负责任AI报告的标准化明显不足。包括OpenAI、Google和Anthropic在内的主要开发者主要针对不同的负责任AI基准测试他们的模型。这种做法使得系统比较顶尖AI模型的风险和限制变得复杂。

生成AI的投资飙升。尽管去年整体AI私人投资有所下降,但生成AI的资金激增,从2022年的资金几乎增加了八倍,达到252亿美元。包括OpenAI、Anthropic、Hugging Face和Inflection在内的生成AI领域的主要玩家报告了大量的筹资轮。

数据显示:AI使工人更加生产效率高,且工作质量更高。2023年,几项研究评估了AI对劳动力的影响,表明AI使工人完成任务的速度更快,并提高了他们的产出质量。这些研究还展示了AI弥合低技能和高技能工人之间技能差距的潜力。然而,其他研究提醒,未经适当监督使用AI可能会导致性能下降。

科学进展得益于AI而进一步加速。2022年,AI开始推动科学发现。2023年,则见证了更多重大的科学相关AI应用的推出——从AlphaDev(使算法排序更高效)到GNoME(促进材料发现过程)。

美国AI相关法规的数量急剧增加。美国的AI相关法规在过去一年以及过去五年中显著增加。2023年,AI相关法规达到25项,从2016年的仅1项大幅上升。仅去年,AI相关法规的总数就增长了56.3%。

全球人们对AI的潜在影响有了更多认识——也更加紧张。Ipsos的一项调查显示,过去一年中,认为AI将在未来三到五年内极大影响他们生活的人的比例从60%增加到了66%。此外,52%的人对AI产品和服务表示紧张,较2022年上升了13个百分点。在美国,Pew的数据表明,52%的美国人报告说他们对AI感到的担忧超过了兴奋,从2022年的37%上升。

成为VIP会员查看完整内容
69

在过去的二十年中,数字孪生(DTs)已成为工业生产和日常生活未来发展的智能代表。本综合手册包括超过50章节,由100多位贡献者撰写,解释了DTs的概念、架构、设计规范和应用场景。 作为一个过程、产品或服务的虚拟模型,以匹配虚拟与现实世界,DTs通过使用模拟来允许数据分析和系统监控。这一快速增长的技术近年来已被广泛研究和开发。以集中化、完整性和动态性为特点,它是推动创新和性能的成本效益选择。许多领域已看到其在工业生产、医疗保健、智慧城市、交通和物流中的适应和实施。如西门子、特斯拉、ANSYS和通用电气等世界著名企业已建立智能工厂并引领数字生产,迈向工业4.0。 本书旨在为该领域的技术人员、相关专业的学生和学者以及对智能工业制造感兴趣的普通读者提供DTs的深入理解和参考。

关于作者 吕智汉博士是瑞典乌普萨拉大学游戏设计系副教授。他同时是IEEE高级会员、英国计算机学会会员、ACM杰出演讲者、斯坦福大学科学影响排名终身前2%的科学家、玛丽·居里学者、Clarivate高被引科学家和Elsevier高被引中国研究者。他已发表300篇学术论文,其中包括90多篇IEEE/ACM Transactions论文。他是《物联网与网络物理系统》(KeAi出版)的主编,同时是多个期刊的副主编,包括ACM TOMM、IEEE TITS、IEEE TNSM、IEEE TCSS、IEEE TNSE和IEEE CEM。他已审阅400篇论文。他已获得来自中国、欧洲和IEEE的20多个奖项。他已为欧洲和中国的大学和公司做过80多次邀请报告。他在国际会议上发表了20次主旨演讲。

成为VIP会员查看完整内容
64

人工智能领域最近见证了显著的增长,导致开发了在各种领域表现出色的复杂深度学习模型。然而,这些发展带来了关键问题。深度学习模型容易继承并可能加剧其训练数据中存在的偏见。此外,这些模型的复杂性导致缺乏透明度,这可能导致偏见未被发现。这最终可能阻碍这些模型的采用,因为缺乏信任。因此,培养本质上透明、可信和公平的人工智能系统至关重要。本论文通过探索深度学习的可解释性和自解释模型,为这一研究领域做出了贡献。这些模型代表了向更透明系统的转变,提供了与模型架构密切相关的解释,揭示了它们的决策过程。因此,这种固有的透明性增强了我们的理解,从而提供了解决无意中学习偏见的机制。为了推进自解释模型的发展,本论文进行了对当前方法的全面分析。它引入了一个旨在提高某个最先进模型解释质量的新算法。此外,这项工作还提出了一种新的自解释模型,通过学习的解码器生成解释,促进端到端训练,并解决了解释性和性能之间普遍存在的权衡问题。此外,为了增强这些模型的可及性和可持续性,本论文还介绍了一种通用方法,无需重新训练即可将任何预训练的黑盒模型转化为自解释模型。通过所提出的方法,这项研究识别并抵制了从数据中学习的人为因素—虚假相关性,进一步强调了透明模型的需求。此外,本论文的范围还扩展到了大型语言模型的公平性维度,展示了这些模型加强社会偏见的倾向。这项研究的结果凸显了所提方法的有效性,从而为创建不仅准确而且透明、公平和可靠的人工智能系统铺平了道路,以促进人工智能技术的广泛采用和信任。

成为VIP会员查看完整内容
64

🌟 ChatGPT引领全球AI热潮,成为自然语言处理领域的里程碑。🔍 报告深入分析ChatGPT技术发展,揭示其在多轮对话、内容生成和语义识别等方面的卓越性能。🌐 中国科技企业积极布局,自主研发大型语言模型,以迎接全球科技竞争新挑战。 🔑 通过技术对比,揭示国内外大语言模型在参数量、输入长度、访问方式等方面的差异与特点。💡 大型语言模型正重塑数字产业生态,推动搜索引擎、办公软件等领域的创新与变革。🛡️ 面对AI带来的风险与挑战,业界正采取多种措施,包括人类反馈强化学习等,以确保AI技术的健康发展。 🌈 报告展望了AI技术如何影响个体能力评价体系和社会文化,预示着一个全新的全球人工智能时代的到来。

成为VIP会员查看完整内容
69

智能规划又叫自动规划,主要研究在复杂环境下,如何通过自动化的方式生成可行的行动序列,以实现从初始状态到达目标状态。大语言模型是指使用大量文本数据训练的深度学习生成式模型,可以生成自然语言文本或理解语言文本的含义。当前围绕如何让大语言模型在强大的常识性知识基础上获得生成式智能规划能力已然成为当下研究的热潮。本文从大语言模型的视角入手,首先对智能规划的定义和发展进行概述、简要介绍了传统智能规划的方法;其次基于大语言智能体与智能规划的紧密关系,介绍了大语言模型的架构和典型的大模型智能体;再次重点围绕大模型的智能规划,梳理了规划语言学习、思维链推理、反馈优化和流程自动化共4类规划方法;最后结合当前的挑战与困难,介绍大模型进行智能规划的前沿研究展望。

成为VIP会员查看完整内容
61

与决策相关的活动,如自下而上和自上而下的策略制定、分析和规划,都将受益于基于计算机的模型的开发和应用,这些模型能够在当地环境中表现人类的时空社会行为。在努力了解和寻找减缓气候变化特定影响的方法时尤其如此,在这种情况下,此类模型需要包括相互影响的社会和生态要素。此类模型的开发和应用一直受到以下挑战的严重阻碍:设计行为以经验证据和理论为基础的智能体,以及测试智能体代表现实世界决策者行为的能力。本论文通过以下方法克服了这些挑战,从而提高了开发此类模型的能力: (a) 三个新框架,(b) 两种新方法,以及 (c) 两种新的开源建模工具。这三个新框架包括 (a) SOSIEL 框架,它为开发新一代认知、多智能体和基于知识的模型提供了一个有理论基础的蓝图,这些模型由具有认知架构的智能体组成; (b) 一个分析决策者有界理性的新框架,它为分析决策情境与决策者决策之间的关系提供了洞察力和便利;以及 (c) 一个分析人工智能体双重有界理性(DBR)的新框架,它对决策情境与人工智能体决策之间的关系做了同样的分析。这两种新方法包括 (a) 用于获取和操作决策知识的 SOSIEL 方法,它提高了我们为认知模型、多智能体模型和基于知识的模型获取、处理和表示决策知识的能力;以及 (b) 用于测试人工智能体表示人类决策能力的 DBR 方法。这两个开源建模工具包括 (a) SOSIEL 平台,这是一个基于认知、多智能体和知识的平台,用于模拟人类决策;以及 (b) 将该平台作为 SOSIEL 人类扩展(SHE)应用于现有的森林气候变化模型,即 LANDIS-II,以便分析人类与森林气候之间的共同进化互动。为了提供示例背景和知识获取指南,论文包括乌克兰喀尔巴阡山地区社会生态互动的案例研究,该地区目前正在应用 LANDIS-II 和 SHE。因此,本论文通过以下方式推动科学发展 (a) 为下一代基于认知、多智能体和知识的模型提供理论基础并展示其实施;(b) 为理解、分析和测试人工智能体代表人类决策的能力提供植根于心理学的新视角。

成为VIP会员查看完整内容
60

来源:IDC咨询

  近日,IDC联合百度智能院发布《2204AI原生应用生态白皮书》。白皮书指出,随着智能数字化浪潮的翻涌,生成式AI已然成为数字经济变革的领航者,逐渐渗透至全球经济体系的各个层面,犹如驱动经济发展的“智慧引擎”。   首先,生成式AI市场正在迅速膨胀,成为推动IT市场发展的重要驱动力。IDC数据显示,预计到2027年,全球对生成式AI的投资总额将大幅跃升至1454亿美元。中国作为全球经济的重要参与者,在这个领域内也展现出强劲的发展势头和坚定的战略投入。IDC预计,2027年,中国对该领域的投资额将激增至129亿美元,2023~2027年期间年复合增长率高达55.1%,其中,生成式AI软件市场同期年复合增长率将高达58.2%,其扩容速度足以引领行业创新前沿。   此外,生成式AI对全球经济的贡献还体现在它深远且广泛的间接经济效益上。IDC预测,得益于生成式AI技术的持续进步与广泛应用,其每年能够为全球经济体系注入2.6万亿至4.4万亿美元的增值潜能,并在逐渐渗透企业运营的各个层面,推动着研发设计、生产制造、市场营销、售后服务等关键环节的优化升级和转型。   生成式AI开辟商业新路径,提升体验并催生新的服务模式   在智能数字化优先的新时代背景下,生成式AI以其快速迭代的特性开辟了一条充满无尽可能的崭新商业路径。该技术不仅大幅提升个人与企业用户体验,实现内容创作、个性化服务的高效化与精准化,还在优化生产流程、催生新商业机会(如AI训练师、AI教育培训等)方面发挥了关键作用,助力企业在全球竞争中抢占战略先机的同时,释放出庞大的市场潜力与经济效益。   IDC预计:2027年全球生成式AI市场规模将达1454亿美元;在中国,该市场规模将增至129亿美元,2023~2027年年复合增长率高达55.1%。

  生成式AI的价值与挑战并存,构建或参与AI原生应用生态体系成为企业战略要务   生成式AI技术在赋予企业显著的效能提升与商业价值创造能力的同时,也带来了一系列待解决的风险与挑战,诸如对高性能计算资源的高需求、模型部署及优化的复杂度升高、数据管理的严谨要求提升、安全保障措施的周密布局难以保证以及紧跟技术革新步伐的的持续适应能力不足等。   为化解这些难题,确保AI技术更稳健地与实体经济融合并协同发展,业界正积极推动由孤立的AI原生应用向健全完善的AI原生应用生态系统转型。   IDC指出,这一生态系统的核心在于以AI大模型为核心支柱,通过开发和部署各类AI原生应用来串联产业链上的合作伙伴,创造新的服务模式,全产业链共同挖掘并实现商业潜能。   此生态系统涵盖生态构建主体、关键合作创新者以及各行业参与者,且随着市场需求及环境的变化,对其中所有角色的功能定位和技术要求也在不断提升:   生态构建者须开放包容,与伙伴共筑协同繁荣之路:生态构建者在系统中发挥着核心作用,在生成式AI时代下需展现出更为开放包容的姿态,积极倡导并鼓励各合作伙伴及客户间形成紧密协同效应,各自发挥核心优势,共同砥砺前行,推动AI原生应用生态系统的繁盛壮大。   生态关键共创者须深思定位,深化合作以推动AI应用革新:生态关键共创者是生态系统中的重要合作伙伴,其角色定位不应止步于简单的“信息传递者”,而应深入挖掘自身潜力,进行战略性的思考与革新。通过与生态系统内部其他伙伴开展深度合作和资源共享,多方合力促进AI原生应用领域的深化拓展和技术进步,实现互惠互利的长远发展目标。

  角色交融促多元生态,深度协作驱动AI广泛应用   伴随AI原生应用技术的迅猛演进与拓宽延展,生态系统内部的角色界定日益呈现交叉融合的趋势,预示着不同的参与者将在功能和责任上展开更为紧密和深入的互渗整合。这一过程对于塑造一个多维度、充满创新精神的生态系统至关重要。   这种角色交融的动态不仅增强了整个生态系统的多样性和创新能力内涵,而且强有力地催化了各利益相关方之间的深层次协同合作与资源共享机制的建立,从而为AI原生应用的大范围普及推广提供了强大的驱动力量。

  在智能数字化优先的大时代背景下,IDC首次提出AI原生应用生态评估框架,以全面评估生态搭建者在AI原生应用生态系统中的综合实力   该框架涵盖市场表现、平台实力、服务支持、商业变现和社区建设等五大指标。   基于该框架,IDC针对中国市场中的AI原生应用生态搭建者的综合实力展开评估。评估结果显示:目前虽然整体行业在平台实力和市场表现方面表现尚可,但在商业变现等维度仍有提升空间,面对挑战与难题,各方需持续努力,以实现从技术理论到商业价值的有效转换。

具体内容如下:

成为VIP会员查看完整内容
56

传统的建模、仿真和分析(MS&A)大多由工程模型支持,即基于牛顿物理学的封闭系统的确定性表征。这种方法并不适合表现人类行为的复杂性。这项研究倡导并试图阐明一种更加以人为本的 MS&A 方法的概念,这种方法可以更好地代表决策和人类行为的其他认知方面,就像代表身体活动一样。

首先将个人和群体视为复杂的适应系统,而这种系统最好使用基于智能体的建模来表示。通过智能体对人类行为的表征包含了决策模型、知识工程和知识表征,以及人与人之间及其与环境之间的心理和生理互动的全部内容。这种表征方式的典型例子是将态势感知/态势理解(SA/SU)作为核心要素加以考虑。

由此,开发了一个概念验证模拟,模拟一个具体、易于理解和量化的人类行为实例:智能体在模拟世界中试图导航时在空间上 "迷失 "了方向。这个模型被命名为 "智能迷失模型"(MOBIL),因为这两种状态的能力是模拟的核心。MOBIL 采用面向对象的软件原理与基于智能体的建模相结合的方式,建立了应用以人为本的分析方法的实用性。

在一些虚拟实验中应用该模拟,说明了它如何支持对个人的 SA/SU 和相关决策过程进行调查。

成为VIP会员查看完整内容
58

完全自主的航空系统(FAAS)将边缘和云硬件与无人机和大量软件支持结合起来,以创建自主系统。FAAS 通过对环境的实时感知和响应,在无人驾驶的情况下完成复杂的任务。FAAS 需要高度复杂的设计才能正常运行,包括机载、边缘和云硬件和软件层。FAAS 还需要复杂的软件,用于控制无人机的底层操作、数据收集和管理、图像处理、机器学习、任务规划和高层决策,这些软件必须在整个计算层次结构中有效集成,以实时实现自主目标。

即使是相对简单的 FAAS,其复杂性也难以保证效率。然而,效率对 FAAS 的有效性至关重要。FAAS 在资源稀缺的环境中执行任务,如自然灾害地区、农田和偏远的基础设施设施。这些地区的计算资源、网络连接和电力都很有限。此外,无人机电池寿命短,飞行时间很少超过 30 分钟。如果 FAAS 设计不合理,无人机可能会浪费宝贵的电池寿命来等待远程计算资源的进一步指示,从而延误或无法完成任务。因此,FAAS 设计人员必须谨慎选择或设计边缘硬件配置、机器学习模型、自主策略和部署模式。

FAAS 有能力彻底改变许多行业,但要提高其可用性和有效性,还有许多研究工作要做。在本论文中,我将概述自己为设计和实施高效、有效的 FAAS 所做的努力。本文将重点讨论以下五个主题,包括 FAAS 的设计、实施和应用:

§1. 创建新的通用和特定领域的机器学习算法,并谨慎使用其他算法

§2. FAAS 层次结构中各级硬件的选择

§3. 为自主策略、硬件设备、机器学习技术和部署特性的选择和切换提供动力和环境意识信息。

§4. 在线学习能力可抵御有限的云访问、网络中断和电力短缺。

§5. 全面的应用,展示 FAAS 的技术价值,推动采用,并确定未来的研究挑战。

图:FAAS 非常复杂。它们在远程环境中运行,使用新颖的自主策略和机器学习算法,必须承受功率限制并利用创造性的网络解决方案来实现其目标。

成为VIP会员查看完整内容
56
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员