2021年7月9日,由中国电子技术标准化研究院、全国信标委人工智能分委会和上海市人工智能标准化技术委员会主办的2021世界人工智能大会“共话标准,驱动产业——标准化分论坛”在上海成功举办。分论坛发布了《人工智能标准化白皮书》。

党中央、国务院高度重视新一代人工智能发展。习近平总书记指出:“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带 动性很强的‘头雁’效应”。“加快发展新一代人工智能是我们赢得全球 科技竞争主动权的重要战略抓手”。为应对新冠肺炎疫情的冲击,党中央 国务院将新型基础设施建设上升为国家战略,其中重要的一项就是人工智 能。国务院发布实施了《新一代人工智能发展规划》等文件,以新一代人 工智能技术的产业化和集成应用为重点,以加快人工智能与实体经济融合 为主线,着力推动人工智能技术、产业全面健康发展。

在政产学研用各方共同努力下,我国人工智能产业发展的成果显著。一是创新能力不断增强,图像识别、智能语音等技术达到全球领先水平, 人工智能论文和专利数量居全球前列。二是产业规模持续增长,京津冀、 长三角、珠三角等地形成了完备的人工智能产业链。三是融合应用不断深 入,智能制造、智慧交通、智慧医疗等新业态、新模式不断涌现,对行业 发展的赋能作用进一步凸显。

我国人工智能产业发展取得显著成绩的同时,面临着不少困难和挑战,比如底层技术存在较大欠缺、能够实现商业价值的应用较少、与实体经济的融合存在较高门槛等。《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》指出 要“强化标准引领,提升产业基础能力和产业链现代化水平”。人工智能 产业的发展离不开标准的引领,扎实做好人工智能标准化工作,对突破核 心技术、加快应用落地、完善产业生态具有重要意义。

本白皮书在《人工智能标准化白皮书(2018版)》的基础上,进一步提出了以下内容:一是从产业链的角度,分析了人工智能产业现状及发 展趋势;二是介绍了当前国际上普遍认可的系统生命周期模型、人工智能 生态系统框架和机器学习技术框架;三是梳理了国内外主要人工智能标准 化组织的重点工作;四是落实《国家新一代人工智能标准体系建设指南》 (国标委联〔2020〕35号),形成人工智能标准体系框架及标准体系明细 表;五是结合标准化工作进展及标准体系建设情况,提出我国人工智能标 准化重点工作建议。

成为VIP会员查看完整内容
0
94
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【导读】佛罗里达大学电子与计算机工程系教授Sean Meyn撰写的新书稿《强化学习与控制系统》,重点讲述了与强化学习最相关的控制基础,以及基于这些基础的RL算法设计的大量工具。

Sean Meyn,佛罗里达大学电子与计算机工程系教授兼Robert C. Pittman杰出学者主席,认知与控制实验室主任,佛罗里达可持续能源研究所所长。Sean于1982年获得加利福尼亚大学洛杉矶分校数学学士学位,于1987年获得麦吉尔大学电子工程博士学位。他的学术研究兴趣包括决策和控制的理论与应用,随机过程和优化。他在这些主题上的研究获得了许多奖项,并且是IEEE会士。

http://www.meyn.ece.ufl.edu/

为了定义强化学习(RL),首先需要定义自动控制。例如,在你的日常生活中,可能包括你的汽车巡航控制,你的空调恒温器,冰箱和热水器,以及现代的衣物烘干机的决策规则。有收集数据的传感器,有收集数据以了解世界状态的计算机”(汽车以正确的速度行驶吗?毛巾还湿吗?),根据这些测量结果,由计算机驱动的算法会发出命令来调整需要调整的东西:油门、风扇速度、加热盘管电流,或者……更令人兴奋的例子包括太空火箭、人造器官和微型机器人来进行手术。RL的目标是真正自动的自动控制:没有任何物理学或生物学或医学知识,RL算法调整自己成为一个超级控制器: 最平稳的飞行进入太空,和最专业的微型外科医生! 这个梦想在大多数应用中肯定是遥不可及的,但最近的成功故事鼓舞了工业界、科学家和新一代学生。继2015年击败欧洲围棋冠军樊麾之后,DeepMind的AlphaGo再次刷新了世界纪录。不久之后的新闻是令人震惊的AlphaZero续集,它在“没有任何专家帮助的情况下”自学下国际象棋和围棋。这在现在看来已经不是什么新鲜事了,似乎每个月都会有新的突破。

今天的强化学习有两个同等重要的基础: 1. 最优控制:两个最著名的RL算法,TD-和q -学习,都是关于逼近最优控制的核心价值函数。2. 统计和信息理论。RL中的loration是本书的一大焦点,它强调了最优控制的几何性质,以及为什么创建可靠的学习算法并不困难。我们不会忽视第二个基础: 动机和成功的启发式将在不深入研究理论的情况下进行解释。读者将学到足够的知识,开始尝试自制的计算机代码,并拥有一个大的算法设计选择库。在完成这本书的一半之前,我希望学生能对为什么这些算法被期望是有用的以及为什么它们有时会失败有一个扎实的理解。

本书的重点是与强化学习最相关的控制基础,以及基于这些基础的RL算法设计的大量工具。

成为VIP会员查看完整内容
0
71

这本书的三个主要部分对应了论文从构思到出版的三个主要阶段: 计划、写作和出版。在这本书的各个章节中,一些复杂的问题如“如何写导言?”或“如何提交手稿?”,这些问题会被分解成更小、更容易处理的问题,然后以直接、对话的方式进行讨论,提供轻松愉快的阅读体验。

以母语不是英语的科学家为目标,撰写和发表科学论文,在该领域脱颖而出。在谈到文体和语法问题的同时,这本书的主要目标是就沟通的首要原则提出建议。

这本书是一个极好的资源,任何学生或科学家希望了解更多关于科学出版过程和科学传播。对于那些来自英语世界以外、想要寻找一本全面的英文出版指南的人来说,这本书尤其有用。

成为VIP会员查看完整内容
0
68

历经半个世纪的发展,人工智能正在社会经济生活中发挥越来越重要的作用。认知智能是一种赋予机器模拟人类认知思考能力的技术,作为人工智能发展的高级阶段,具有交互性、情境性与适应性等特点。认知智能“能理解、会思考”的能力,可以极大地将人类从重复体力劳动和简单脑力劳动中解放出来。

当前,认知智能产业生态已初步形成,产业应用加快落地,技术研发持续突破,涌现出一批具有代表性的企业,俨然成为城市数字化浪潮中的关键驱动力。中国信息通信研究院华东分院联合竹间智能科技(上海)有限公司就人工智能全球态势、认知智能产业生态、技术融合、典型案例与未来趋势等方面开展了产业技术分析,形成《2021 认知智能发展研究报告》。

本报告由五大篇章组成:第一篇章:全球态势篇,对全球人工智能政策环境、发展现状与发展热点进行了详细介绍;第二篇章:产业生态篇,阐述了认知智能发展历程,并从行业生态、技术专利、学术研究和产业标准等方面展开具体分析;第三篇章:技术融合篇,阐述了当前认知智能领域情感计算、知识图谱、图像理解等六大行业技术领域的融合发展情况;第四篇章:典型案例篇,阐述了当前认知智能在金融、制造、教育等六大场景的应用落地总体情况与典型产品案例;第五篇章:未来趋势篇,总结了认知智能发展面临的问题挑战,对未来发展做出展望。

![](https://cdn.zhuanzhi.ai/vfiles/cda708330603af4a33f9306eed4532e3)
成为VIP会员查看完整内容
0
53

主动学习是一种有监督的机器学习协议,其中学习算法从大量未标记数据中序列地请求选定数据点的标签。这与被动学习形成了对比,被动学习是随机获取有标记的数据。主动学习的目标是产生一个高度精确的分类器,理想情况下使用的标签要比被动学习达到同样目的所需的随机标记数据的数量少。这本书描述了我们对主动学习的理论益处的理解的最新进展,以及对设计有效的主动学习算法的启示。文章的大部分内容都集中在一种特殊的方法上,即基于不同意见的主动学习,到目前为止,这种方法已经积累了大量的文献。它还从文献中简要地考察了几种可供选择的方法。重点是关于一些一般算法的性能的定理,包括适当的严格证明。然而,本文的目的是教学,集中于说明基本思想的结果,而不是获得最强或最普遍的已知定理。目标受众包括机器学习和统计学领域的研究人员和高级研究生,他们有兴趣更深入地了解主动学习理论最近和正在进行的发展。

成为VIP会员查看完整内容
1
52

ICML 2021的论文接收结果已经公布,今年一共有5513篇有效投稿,其中1184篇论文被接收,接收率为21.5% 。另外在这1184篇被接收论文中,有166篇长presentations和1018篇短presentations。

1000多篇论文不可能看过来,那怎么办?最近Paper Digest Team发布了一个《一句话点评论文亮点的系统,涵盖1183篇论文的亮点,有122页pdf之多,这样大大帮助读者锁定想看的论文!

地址: https://www.paperdigest.org/2021/07/icml-2021-highlights/

每一行是一篇论文,包含论文题目、作者和论文摘要亮点。读者直接点击论文题目可跳转到论文pdf页面查看下载。

总共包含了1183篇论文!

为了帮助社区快速查找会议上的工作,Paper Digest团队处理所有被接受的论文,并为每篇论文生成一个亮点总结(通常是主要主题)。鼓励读者阅读这些机器生成的要点/摘要,以快速获得每篇论文的主要思想。

成为VIP会员查看完整内容
0
45

《强化学习与控制》是一门由清华大学智能驾驶课题组李升波教授亲自讲授的强化学习课程,该课程总共包含11讲,以理论基础与算法设计融合的方式介绍了RL的框架体系,从优化角度梳理了直接法与间接法,带模型与免模型等类别,并对典型算法原理和特性进行了分析和总结,是一门兼顾基础入门、进阶提升的强化学习课程。

一、关于课题组

智能驾驶课题组(iDLab, Intelligent Driving Lab) 面向下一代机器学习和自动控制的交叉理论探索,聚焦智能网联汽车和驾驶辅助系统的核心技术研发,进一步提升汽车的智能性、安全性和节能性。 http://www.idlab-tsinghua.com/thulab/labweb/index.html

二、关于主讲老师:李升波教授

李升波,清华大学长聘教授,博导,车辆学院副院长。留学于斯坦福大学,密歇根大学和加州伯克利大学。从事自动驾驶、智能汽车、强化学习、最优控制等研究。发表论文110余篇,引用>8500次,H因子45。入选IEEE高关注度及封面论文3篇,ESI高引10篇(学科前1%),学术会议最佳论文奖8次。获中国汽车工业科技进步特等奖、国家科技进步二等奖、国家技术发明二等奖等。入选国家高层次科技创新领军人才、交通运输行业中青年科技创新领军人才、中国汽车行业优秀青年科技人才奖、首届北京市基金委杰青、清华大学教师学术新人奖等。担任AI国际评测MLPerf自动驾驶咨询委员会委员、IEEE智能交通系统学会的全球理事会委员、IEEE Trans on ITS副主编等。

三、关于《强化学习与控制》课程

目前,人工智能的快速崛起正重塑人类社会的各个领域,有望引导工业文明进入新一轮革命浪潮。以道路交通为例,汽车的智能化变革促使整个行业发生了翻天覆地的变化,包括驾驶辅助、自动驾驶、云控协同等一系列新技术如雨后春笋般涌现,它们在提升地面车辆行驶性能的同时,也为解决交通事故、排放污染、城市拥堵等问题提供了一条可行的途径。

以模仿人类大脑学习机制为原理的强化学习(RL,Reinforcement Learning)正迅速进入人们的视野,它为大规模复杂系统的学习及动态系统的高实时在线控制提供了一套极具前景的解决方案。一个引人注目的成功案例是以Alpha Go为代表的围棋智能:它利用深度强化学习算法实现围棋智能的自我进化,自我超越,打败人类最好的专业棋手。尽管强化学习具有优异的潜在优势,但是该方法的工程应用尚属于起步阶段。

《强化学习与控制》这一门课程包括11节。

第1讲介绍RL概况,包括发展历史、知名学者、典型应用以及主要挑战等。

第2讲介绍RL的基础知识,包括定义概念、自洽条件、最优性原理问题架构等。

第3讲介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。

第4讲介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。

第5讲介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。

第6讲介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。

第7讲介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。

第8讲介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。

第9讲介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。

第10讲介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系

第11讲介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。

成为VIP会员查看完整内容
0
38

摘要: 机器学习(ML)中的可解释性对于高风险决策和故障排除是至关重要的。在这项工作中,我们提供了可解释性ML的基本原则,并消除了淡化这一关键话题的重要性的常见误解。我们还确定了可解释机器学习的10个技术挑战领域,并提供了每个问题的历史和背景。这些问题中有些是典型的重要问题,有些是最近几年才出现的问题。这些问题包括: (1)优化决策树等稀疏逻辑模型; (2)评分系统优化; (3)在广义加性模型中放置约束,以促进稀疏性和更好的可解释性; (4)现代案例推理,包括神经网络和匹配因果推理; (5)神经网络的完全监督解缠; (6)神经网络的完全或部分无监督解缠; (7)数据可视化降维; (8)能够结合物理和其他生成或因果约束的机器学习模型; (9)良好模型的“罗生门集”的刻画; (10)可解释强化学习。该综述适合作为对可解释机器学习感兴趣的统计学家和计算机科学家的起点。

引言

随着机器学习(ML)的广泛应用,可解释性在避免灾难性后果方面的重要性变得越来越明显。黑箱预测模型的定义是不可思议的,它已经导致严重的社会问题,深刻影响健康、自由、种族偏见和安全。可解释预测模型受到限制,因此其推理过程更容易被人类理解,也更容易进行故障排除和在实践中使用。人们普遍认为,可解释性是AI模型信任的关键因素(Wagstaff, 2012; Rudin and Wagstaff, 2014; Lo Piano, 2020; Ashoori and Weisz, 2019; Thiebes et al., 2020; Spiegelhalter, 2020; Brundage et al., 2020)。在这项综述中,我们提供了基本原理,以及内在可解释机器学习模型设计中的10个技术挑战。

让我们提供一些背景资料。黑盒机器学习模型是一个公式,它要么太复杂,任何人都无法理解,要么是专有的,以至于人们无法理解其内部工作原理。黑盒模型很难排除故障,这对于医疗数据来说尤其成问题。黑箱模型通常会在错误的原因下预测正确的答案(“聪明的汉斯”现象),导致在训练中表现优异,但在实践中表现不佳(Schramowski et al., 2020; Lapuschkin et al., 2019; O’Connor, 2021; Zech et al., 2018; Badgeley et al., 2019; Hamamoto et al., 2020)。黑盒模型还有许多其他问题。在刑事司法方面,个人可能会因为黑箱模型输入的印刷错误而遭受多年的额外监禁(Wexler, 2017),而设计不佳的空气质量专有模型在野火期间对公共安全造成了严重后果(McGough, 2018);这两种情况都很容易用可解释模型来避免。在数据的底层分布发生变化的情况下(称为域转移,这在实践中经常发生),如果用户不能实时地对模型进行故障排除,那么问题就会出现,而黑盒模型比可解释模型要困难得多。要确定一个黑箱模型在性别或种族群体方面是否公平,要比确定一个可解释的模型是否存在这种偏见要困难得多。在医学领域,黑盒模型将计算机辅助决策转化为自动决策,正是因为医生无法理解黑盒模型的推理过程。解释黑盒,而不是用可解释的模型替代它们,可能会通过提供误导性或错误的描述使问题变得更糟(Rudin, 2019; Laugel et al., 2019; Lakkaraju and Bastani, 2020),或者给黑匣子增加不必要的权力(Rudin and Radin, 2019)。显然,我们需要具有内在可解释性的创新机器学习模型。

本综述的主要部分概述了可解释性机器学习中一系列重要和基本的技术重大挑战。这些挑战既有现代的,也有古典的,有些挑战要比其他的困难得多。它们要么很难解决,要么很难正确地表述。虽然有许多关于模型部署的社会技术挑战(可能比技术挑战困难得多),人机交互挑战,以及健壮性和公平性如何与可解释性交互,这些话题可以留到以后讨论。我们从可解释机器学习中最经典和最规范的问题开始: 如何为表格数据建立稀疏模型,包括决策树(挑战#1)和评分系统(挑战#2)。然后我们研究了一个涉及加法模型的挑战(挑战#3),接着是另一个基于案例推理的挑战(挑战#4),这是可解释人工智能中的另一个经典主题。然后我们转向更奇特的问题,即在神经网络中有监督和无监督的概念解缠(挑战#5和#6)。回到经典问题,我们讨论降维(挑战#7)。然后,如何整合物理或因果约束(挑战#8)。挑战#9涉及到理解、探索和衡量罗生门精确预测模型集。挑战#10 讨论可解释强化学习。表1提供了一个指南,可以帮助用户将数据集与合适的可解释监督学习技术相匹配。我们将在挑战中涉及所有这些技术。

可解释机器学习原则

  • 原则1: 一个可解释的机器学习模型遵循一组特定领域的约束,使其(或其预测或数据)更容易被人类理解。这些约束会根据域的不同而有很大的不同。

  • 原则2:尽管有常见的修辞,但可解释的模型不一定能创造或促成信任——它们也可能导致不信任。它们只是让用户决定是否信任它们。换句话说,他们允许信任的决定,而不是信任本身。

  • 原则3:重要的是,不要假设一个人需要牺牲准确性来获得可解释性。事实上,可解释性往往会带来准确性,而不是相反。在机器学习中,可解释性和准确性通常是一个错误的二分法。

  • 原则4:作为整个数据科学过程的一部分,性能指标和可解释性指标都应该被反复地改进。

  • 原则5:对于高风险的决策,如果可能的话,应该使用可解释的模型,而不是“解释”的黑盒模型

在这项综述中,我们希望为读者提供一个途径进入可解释机器学习的重要主题。目前有关可解释和可解释AI的文献可能会让人非常困惑。参与这一领域研究的个体多样性不仅包括统计学家和计算机科学家,还包括法律专家、哲学家和研究生,其中许多人从未建立或部署过机器学习模型。人们很容易低估说服别人在实践中使用机器学习模型的难度,而可解释性是一个关键因素。过去几年的许多工作都贡献了新的术语,错误地将旧的可解释机器学习领域纳入了新的领域“XAI”,而且评论论文普遍未能真正区分解释黑箱和设计可解释模型的基本概念。因为有误导性的术语,标题为“可解释性(explainability)”的论文有时是关于“可解释性(interpretability)”,反之亦然,所以很难理解文献(即使是我们)。至少,我们希望介绍一些基本原则,涵盖该领域的几个重要领域,并展示它们彼此之间的关系和与实际问题的关系。显然,这是一个我们无法真正涵盖的巨大领域,但我们希望我们涵盖的不同领域和提出的问题可能对那些需要进入这个迷宫的人有用。

成为VIP会员查看完整内容
0
36

探求事物的原因,是人类永恒的精神活动之一。从古希腊的哲学到中国先秦的诗歌,都充满了对原因的追问和对因果关系的思考。比如,亚里士多德就在《物理学》(Physics)和《形而上学》(Metaphysics)两书中反复强调,我们只有知道了事物的原因,才能算真正理解这个事物。又如,屈原在《天问》开篇,就追问日月星辰运行的原因。

长期以来,人们一方面好奇地追问原因和结果的关系,一方面又苦于这些概念的模糊性。于是,这些话题在很长一段时间都仅仅局限在哲学和文学的范围内。精确地描述因果关系,尤其是用数学的语言来描述因果关系,则是非常近代的事情了。这一项思想飞跃,得益于现代统计学的发展。统计学家称之为“因果推断”(causal inference)。虽然因果推断在现代统计学的萌芽阶段就已经产生,但是它的发展并非一帆风顺:它长期被主流忽视、怀疑甚至攻击。直至最近四十年,尤其是最近十年,它才得到了广泛的认可和大力的研究,成为当今主流的研究方向之一。在最近的一篇文章中,Andrew Gelman 和 Aki Vehtari 评选了过去五十年中,统计学最重要的八个想法,排名第一的就是因果推断1。当今世界,很多年轻的学者加入了因果推断的研究,他们来自统计学、经济学、社会学、政治科学、教育学、流行病学、计算机科学、哲学等等领域。毫不夸张地说,统计因果推断的研究迎来了它发展的黄金时代。

本文将回顾统计因果推断的历史背景,评述中国因果推断研究的现状,并且大胆推测它未来的发展前景。

成为VIP会员查看完整内容
0
36

数据增强是通过转换为机器学习人工创建训练数据,是机器学习学科中一个广泛研究的研究领域。虽然它对于提高模型的泛化能力很有用,但它也可以解决许多其他挑战和问题,从克服有限数量的训练数据到规范目标到限制数据量用于保护隐私。基于对数据增强的目标和应用的精确描述以及现有的分类法作品,该调查涉及用于文本分类的数据增强方法,旨在实现简洁和研究人员和从业人员的综合概述。根据分类法,我们将100多种方法分为12不同的分组,并提供最先进的参考资料,阐述哪些方法非常有前途。最后,研究给出了可能构成未来工作基石的观点。

https://www.zhuanzhi.ai/paper/6a3ab7686edb4fbbc9b7fe15b7a349a4

成为VIP会员查看完整内容
0
37

机器学习是计算机科学的一个子领域,使计算机不需要明确的编程步棸就能够自主学习。它致力于通过学习数据和预测数据来建立各种算法。

机器学习的应用范围非常广泛。它涵盖数学,计算机科学和神经科学的多个领域。这是一个试图在一个PDF文件中来总结整个机器学习领域。

成为VIP会员查看完整内容
0
36

本教程将介绍自注意力机制在计算机视觉中的应用。Self-Attention在NLP中被广泛采用,完全注意的Transformer模型已经在很大程度上取代了RNN,现在被用于最先进的语言理解模型,如GPT、BERT、XLNet、T5、Electra和Meena。因此,人们对研究自注意力是否能在计算机视觉中产生同样巨大而深远的影响产生了极大的兴趣。然而,由于视觉任务与语言任务具有不同的性质,因此许多研究都致力于探索自注意力在视觉模型中的最佳应用方式。本教程将涵盖视觉中自注意力的许多不同应用,以便让用户对这个子领域有一个广泛而精确的理解。

https://icml.cc/Conferences/2021/Schedule

成为VIP会员查看完整内容
0
35

软件已经成为当代生活的一个关键组成部分,而对任何符合数字形式的东西进行排名、分类或推荐的算法技术无处不在。这本书在概念上和历史上接近信息排序的领域。以Gilbert Simondon的哲学和文化技术传统为基础,它首先考察了软件的建设性和累积性特征,并展示了软件制作如何不断利用现有知识和技术的大量储备。然后,它重建了一系列算法技术的历史轨迹,这些技术实际上已经成为当代秩序实践的基石。坐标索引、文本处理、机器学习和网络算法是相对于几个世纪的图书馆传统而发展起来的,它们实例化了动态的、视角主义的、感兴趣的安排信息、思想或人员的形式。在技术基础设施和经济逻辑的包围下,这些技术已经成为改变空间的有序引擎。

成为VIP会员查看完整内容
0
35

《现代统计学导论》是对之前的游戏《统计学与随机化和模拟导论》的重新构想。这本新书着重强调了探索性数据分析(特别是使用可视化、摘要和描述性模型探索多元关系),并提供了使用随机化和引导的基于模拟的推理的全面讨论,接着介绍了基于中心极限定理的相关方法。

第1部分:数据介绍。数据结构、变量、摘要、图形、基本数据收集和研究设计技术。 第2部分:探索性数据分析。数据可视化和总结,特别强调多变量关系。 第3部分:回归建模。用线性和逻辑回归建模数值和分类结果,并使用模型结果来描述关系和作出预测。 第4部分:推理的基础。案例研究被用来引入随机测试、bootstrap间隔和数学模型的统计推理的思想。 第5部分:统计推断。使用随机化测试、引导间隔和数值和分类数据的数学模型的统计推断的进一步细节。 第6部分:推理建模。扩展推理技术提出了迄今为止的线性和逻辑回归设置和评估模型性能。

我们希望读者能从本书中汲取三种思想,并为统计学的思维和方法打下基础。

  1. 统计学是一个具有广泛实际应用的应用领域。

  2. 你不必成为数学大师,也可以从有趣的、真实的数据中学习。

  3. 数据是混乱的,统计工具是不完善的。

地址:

https://www.openintro.org/book/ims/

成为VIP会员查看完整内容
0
35

面对人工智能引发的全球信任焦虑,发展可信人工智能已经成为全球共识。2019年6月,二十国集团(G20)提出“G20人工智能原则”,强调要以人为本、发展可信人工智能,这一原则也得到了国际社会的普遍认同。欧盟和美国也都把增强用户信任、发展可信人工智能放在其人工智能伦理和治理的核心位置。将抽象的人工智能原则转化为具体实践,落实到技术、产品和应用中去,是回应社会关切、解决突出矛盾、防范安全风险的必然选择,是关系到人工智能长远发展的重要议题,也是产业界急需加快推进的紧迫工作。

论坛上发布了由中国信通院与京东探索研究院联合撰写的国内首本《可信人工智能白皮书》,白皮书从如何落实全球人工智能治理共识的角度出发,聚焦于可信人工智能技术、产业和行业实践等层面,分析了实现可控可靠、透明可释、隐私保护、明确责任及多元包容的可信人工智能路径,并对可信人工智能的未来发展提出了建议。

http://www.caict.ac.cn/kxyj/qwfb/bps/202107/t20210708_380126.htm

白皮书内容简介

本白皮书首次系统提出可信人工智能全景框架,全面阐述可信人工智能的特征要素,剖析了可信人工智能与人工智能科技伦理和治理的关系,促进业界更好的理解可信人工智能。

本白皮书针对可信人工智能中各种支撑技术从理论层面进行了深入浅出的剖析。将技术以稳定性、可解释性、隐私保护、公平性作为量化指标进行了完备的讨论,这些技术构成了可信人工智能地基础支撑能力。

本白皮书创新地从企业和行业实践视角详述可信人工智能的实践路径,是一份极具参考价值的实操指南,对于产业界进一步落实人工智能伦理及治理要求具有重要意义,能够切实推动人工智能产业健康发展。

本白皮书以动态的眼光分析可信人工智能发展脉络,同时对当下社会各界实践可信人工智能、完善可信生态,提出了务实的方案和发展建议。

本白皮书认为,可信人工智能已经不再仅仅局限于对人工智能技术、产品和服务本身状态的界定,而是逐步扩展至一套体系化的方法论,涉及到如何构造“可信”人工智能的方方面面。

下图给出了可信人工智能的总体框架。

成为VIP会员查看完整内容
0
34

近年来,随机矩阵理论(RMT)已经成为学习理论的前沿,作为一种工具来理解它的一些最重要的挑战。从深度学习模型的泛化到优化算法的精确分析,RMT提供了易于分析的模型。

第一部分:介绍和经典随机矩阵理论集合

本节介绍两个经典的随机矩阵理论集合,高斯正交集合和Wishart矩阵。通过数值实验,我们将介绍随机矩阵理论中一些最重要的分布,如半圆和马尔钦科-帕斯图,以及一些关键的概念,如通用性。 图片

第2部分:随机矩阵理论概论:斯蒂尔吉斯和R变换 本节介绍随机矩阵理论中的一些核心证明技术: Stieltjes和R变换。

第3部分:数值算法分析 本节主要介绍随机矩阵理论在数值算法分析中的应用。

第4部分:为什么深度学习有效? 本节讨论深度神经网络泛化的随机矩阵理论模型。

https://random-matrix-learning.github.io/#presentation1

成为VIP会员查看完整内容
0
32

知识图谱推理技术旨在根据已有的知识推导出新的知识,是使机器智能具有和人类一样的推理和决策能力的关键技术之一。系统地研究了知识图谱推理的现代方法,以统一的框架介绍了向量空间中进行知识图谱推理的模型,包括基于几何运算嵌入欧几里得空间和双曲空间的方法,基于卷积神经网络、胶囊网络、图神经网络等深度网络模型的方法。同时,系统地梳理了知识推理技术在各技术领域和各行业的应用情况,指出了当前存在的挑战以及其中蕴含的机会。

成为VIP会员查看完整内容
0
31

算法——通常与大数据、机器学习或人工智能等术语联系在一起——是我们每天使用的技术的基础,关于新算法的实际或潜在后果的争议经常出现。在这本书中,Florian Jaton提供了一种研究计算机化方法的新方法,描述了算法的来源和构成,研究了逐步组装算法的实践活动,而不是一旦组装好算法可能提出的建议或要求。

Jaton对一个专门从事数字图像处理的计算机科学实验室进行了为期四年的人种学研究,阐明了算法发展背后的无形过程。在他所描述的一系列相互交织的行动过程中,分享了共同的最终结果,他描述了通过贴近现实、编程和规划的视角来创建算法的实践活动。他首先提出了建立基本真理,参考知识库,形成了算法的物质基础。在考虑了编程对人种学审查的抵制之后,他描述了他在实验室参加的编程过程。最后,他提供了一个行动方案,成功地阐明了数据库的数据之间的一些关系,揭示了ground-truthing、编程和形成活动之间的联系——导致算法形成的复杂过程。在实践中,ground-truthing、编程和规划形成了一个旋风式的过程,一个紧急的、交织在一起的体系。

https://mitpress.mit.edu/books/constitution-algorithms

成为VIP会员查看完整内容
0
32

现在的组织收集了大量的数据。要使数据对组织产生价值,就必须通过数据进行分析来提取见解,以更好地进行决策。

http://images.china-pub.com/ebook8065001-8070000/8069565/ch01.pdf

成为VIP会员查看完整内容
0
32

由于神经网络的日益普及,对神经网络预测的信心变得越来越重要。然而,基本的神经网络不会给出确定性估计,也不会受到信心过度或不足的影响。许多研究人员一直致力于理解和量化神经网络预测中的不确定性。因此,不同类型和来源的不确定性已被识别,并提出了各种方法来测量和量化神经网络中的不确定性。本工作对神经网络中的不确定性估计进行了全面的概述,综述了该领域的最新进展,突出了当前的挑战,并确定了潜在的研究机会。它旨在给任何对神经网络中的不确定性估计感兴趣的人一个广泛的概述和介绍,而不预设在这一领域有先验知识。对不确定性的主要来源进行了全面的介绍,并将它们分为可约模型不确定性和不可约数据不确定性。本文介绍了基于确定性神经网络、贝叶斯神经网络、神经网络集成和测试时间数据增强等方法对这些不确定性的建模,并讨论了这些领域的不同分支和最新进展。对于实际应用,我们讨论不确定性的不同措施,校准神经网络的方法,并给出现有基线和实现的概述。来自不同领域广泛挑战的不同例子,提供了实际应用中有关不确定性的需求和挑战的概念。此外,讨论了当前用于任务和安全关键的现实世界应用的方法的实际限制,并展望了未来的步骤,以更广泛地使用这些方法。

https://www.zhuanzhi.ai/paper/9a9009dae03438c7a71e0bc1b54de0fa

成为VIP会员查看完整内容
0
30
登录查看的更多。 返回顶部
本周荟萃主题
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
新闻
新闻,是指报纸、电台、电视台、互联网等媒体经常使用的记录与传播信息的 [2] 一种文体,是反映时代的一种文体。新闻概念有广义与狭义之分。广义上:除了发表于报刊、广播、互联网、电视上的评论与专文外的常用文本都属于新闻,包括消息、通讯、特写、速写(有的将速写纳入特写之列)等等; [3] 狭义上:消息是用概括的叙述方式,以较简明扼要的文字,迅速及时地报道附近新近发生的、有价值的事实,使一定人群了解。新闻一般包括标题、导语、主体、背景和结语五部分。前三者是主要部分,后二者是辅助部分。写法以叙述为主兼或有议论、描写、评论等。新闻是包含海量资讯的新闻服务平台,真实反映每时每刻的重要事件。您可以搜索新闻事件、热点话题、人物动态、产品资讯等,快速了解它们的最新进展。
图灵奖
图灵奖(A.M. Turing Award,又译“杜林奖”),由 美国计算机协会(ACM)于1966年设立,又叫“A.M. 图灵奖”,专门奖励那些对计算机事业作出重要贡献的个人。其名称取自计算机科学的先驱、英国科学家 阿兰·麦席森·图灵
Top