“一图胜千言”

为图像处理课程设计(IP)旨在研究生和大四本科生,在任何领域的工程,这本书从第一章概述如何安装摄像头成像雷达的核磁共振成像和猫形态图像,然后继续覆盖广泛的图像处理主题。IP主题包括:图像插值、放大、缩略图和锐化、边缘检测、噪声滤波、模糊图像的去模糊、监督和非监督学习、图像分割等。

成为VIP会员查看完整内容
0
53
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

智能时代,AI 中台是企业管理能力、企业活力、企业“智力”提升的重要动力来源。思考企业的未来,AI 中台将是企业在复杂时代下生存和发展的“必需品”和“必修课”。

日前,百度智能云与人工智能产业发展联盟联合发布了《AI 中台白皮书(2021年)》。AI 中台作为全栈式、集约化、自动化的生产力工具箱,是实现AI技术在各行业中快速研发、共享复用和部署管理的智能化底座和关键基础设施。白皮书旨在深入剖析 AI 中台体系架构与内涵,探讨能力建设路径和行业赋能方案,以期与业界分享,共同推动我国人工智能产业创新发展与行业智能化升级。

白皮书指出,AI 中台是实现智能化能力普惠的必备基础设施,负责构建企业的 AI 生产力,一般包括 AI 技术服务平台、AI 研发平台、AI 管理运行三大核心。

白皮书展开论述了 AI 中台所应具备的四大关键能力。概括来看,AI 数据需求趋于精细化、场景化,健全的数据服务体系会是AI 中台的基础;自动机器学习技术加速演进,AI 研发平台成为了技术普惠的关键;AI 部署运行愈加复杂,体系化工具成为了规模化应用的保障;AI 模型已经成为了企业新型资产,AI 资产化管理势在必行。

企业如何建设自己的 AI 中台体系呢?白皮书给出了两类建设路径和三大要素支撑。

面向企业智能化升级的不同阶段,AI 中台建设有两类路径:一类是对于处于 AI 能力起步期的企业,会先从 AI 能力直接赋能,再逐步发展到自主建模和个性化创新,构建 AI 能力创新底座;另外是面向已具备专业 AI 建模专家及算法团队的企业,可以聚焦个性化 AI 研发能力的构建,进而大幅提升 AI 模型落地应用推广效率。

三大要素则是企业智能化升级的坚实支撑。在基础设施建设方面,AI 中台支撑企业完成软件部署,并与已有的私有云、数据中台、视频平台等 IT 设施进行对接集成。支持企业结合自身业务场景,构建 AI 应用能力,围绕 AI 中台软件、基础应用集成、业务应用集成三大模块,打造企业 AI 能力的核心技术底座。

在组织能力建设方面,AI 中台为企业提供组织变革、流程创新、人才培养等方面建议,通过建立组织保障机制,明确机构中包括模型生产、服务管理、运维保障在内的各个工作组职责及流程,确保 AI中台管理组织的高效运转。此外,帮助企业持续培养人工智能相关的技术开发人员及运营管理人员,保证 AI 能力开发管理的人才供给。

在运营优化方面,AI 应用实际投产后,企业需结合业务反馈数据不断进行优化调整,确保应用成效。

借助高效灵活的适配能力,AI 中台已在制造、能源、金融、城市、医疗等诸多行业落地应用并取得显著成效,切实解决企业生产运行痛点,满足企业设计、生产、管理、销售和运维等个性化场景需求。

展望未来,AI 中台作为企业智能中枢,在不断完善提升自身能力的同时,将成为伴随企业成长、构筑核心竞争力的重要抓手和关键支撑。未来2-5年,AI 中台将作为创新型企业运转不可或缺的基础设施;未来5-10年,AI 中台将融入企业成长的全生命周期,企业建设、应用和运营 AI 中台的能力,将成为衡量未来发展潜力和成长价值的关键指标,助力构筑企业核心竞争力。

以 AI 中台助力行业高质量发展,提升国家供给侧水平,将在数字社会与智能经济时代获得发展先机。过去二十年,移动互联网对人类社会的影响集中体现在 C 端,即需求端;但在 AI 时代,人工智能将更多从 B 端,即供给端改变。AI 中台作为“ AI 大生产平台”的生产力载体,从更好推进 AI 行业落地、实现技术价值增值角度,正在加快帮助企业适应新形势、新变化与新挑战。AI 中台技术所带来的行业变革,将是一场更彻底的供给侧改革,成为推动国家迈进智能未来时代的重要力量。

人工智能革命将个体价值的创造释放提升到前所未有高度,AI 中台通过推动行业智能变革为社会带来更为光明的未来。AI 中台赋能能力正在从通用行业(如制造、金融、教育等)向专业精细化行业(如生物医药、化学化工、半导体等)延伸拓展,帮助企业不断拓展应用视野和创新边界,推动人类社会创新进步。AI 中台将帮助企业追求更有创造力、影响力和领导力的自我价值实现,为整个智能社会带来更大提升空间、更多发展可能。

成为VIP会员查看完整内容
1
46

数据科学概率导论

这本书是大学概率论的入门教材。它有一个使命: 阐明我们在科学和工程中使用的概率工具的动机、直觉和含义。从超过五年的课程教学中,我提炼出了我认为是概率方法的核心。我把这本书放在数据科学的背景下,以强调数据(计算)和概率(理论)在我们这个时代的不可分离性。

地址: https://probability4datascience.com/index.html

概率论是电子工程和计算机科学中最有趣的学科之一。它将我们喜爱的工程原理与现实联系起来,这是一个充满不确定性的世界。然而,因为概率是一门非常成熟的学科,单是本科生的课本就可能在图书馆的书架上摆满好几排书。当文学如此丰富时,挑战就变成了一个人如何在深入细节的同时洞察到洞察力。例如,你们中的许多人以前使用过正态随机变量,但你们是否想过“钟形”是从哪里来的?每一门概率课都会教你抛硬币,但是“抛硬币”在今天的机器学习中有什么用呢?数据科学家使用泊松随机变量来模拟互联网流量,但是这个漂亮的泊松方程是从哪里来的呢?这本书的目的是填补这些知识的差距,这是所有数据科学学生必不可少的。

这就引出了本书的三个目标。(i) 动机: 在数学定义、定理、方程的海洋中,为什么我们要把时间花在这个主题上,而不是其他的? (ii) 直觉: 当进行推导时,在这些方程之外是否有几何解释或物理学?(iii) 言外之意: 当我们学习了一个话题后,我们可以解决哪些新问题?本书的目标读者是电子工程和计算机科学专业的本科生三、四年级和一年级研究生。先决条件是标准的本科线性代数和微积分,除了需要傅里叶变换的特征函数部分。一门信号与系统的本科课程就足够了,即使是在学习这本书的同时选修。

这本书的篇幅适合两学期的课程。教师被鼓励使用最适合他们的课程的章节集。例如,基本概率课程可以使用第1-5章作为主干。关于样本统计的第6章适合希望获得概率收敛理论见解的学生。关于回归的第七章和关于估计的第八章最适合学习机器学习和信号处理的学生。第9章讨论了对现代数据分析至关重要的置信区间和假设检验。第10章介绍了随机过程。我的随机过程方法更适合于信息处理和通信系统,这通常与电气工程专业的学生更相关。

本书特色:

涵盖范围广,从经典的概率论到现代数据分析技术 概念的几何和图形解释 与MATLAB / Python紧密集成 机器学习的实际应用

目录内容

Chapter 1 Mathematical Background Chapter 2 Probability Chapter 3 Discrete Random Variables Chapter 4 Continuous Random Variables Chapter 5 Joint Distributions Chapter 6 Sample Statistics Chapter 7 Regression Chapter 8 Estimation Chapter 9 Confidence and Hypothesis Chapter 10 Random Processes

成为VIP会员查看完整内容
0
45

在过去的几十年里,组合优化和图论——作为组合学的整个领域——经历了特别快速的发展。这一事实有多种原因;一个是,例如,应用组合论证已经变得越来越普遍。然而,数学之外的两个发展可能更为重要:首先,组合优化的许多问题直接产生于工程和管理的日常实践:确定交通或通信网络中最短或最可靠的路径,最大或相容的流量,或最短的线路;规划交通网络的连接;协调项目;解决供需问题。第二,随着越来越高效的计算机系统的发展,那些属于运筹学的任务的实际实例已经可以得到。此外,组合优化问题对复杂性理论也很重要,复杂性理论是数学和理论计算机科学的交叉领域,涉及算法分析。组合优化是数学中令人着迷的一部分,它的魅力——至少对我来说——很大程度上来自于它的跨学科性和实用性。本书主要介绍了可以用图论方法表述和处理的组合优化部分;既不考虑线性规划理论,也不考虑多面体组合理论。

https://www.springer.com/gp/book/9783642322778

成为VIP会员查看完整内容
0
40

本文档包含了物理模拟环境中与深度学习相关的所有内容的实用和全面的介绍。尽可能多地,所有主题都以Jupyter形式提供了实际操作的代码示例,以便快速入门。除了标准的监督学习数据,我们将着眼于物理损失约束,更紧密耦合的学习算法与可微分模拟,以及强化学习和不确定性建模。我们生活在一个激动人心的时代: 这些方法有巨大的潜力从根本上改变计算机模拟所能达到的效果。

在本文中,我们将介绍将物理模型引入深度学习的不同方法,即基于物理的深度学习(PBDL)方法。为了增加集成的紧密性,将引入这些算法变体,并将讨论不同方法的优缺点。重要的是要知道每种不同的技术在哪些场景中特别有用。

成为VIP会员查看完整内容
0
38

该系列课程由DeepMind研究人员教授,与伦敦大学学院(UCL)合作创建,为学生提供现代强化学习的全面介绍。

本课程包括13个讲座,该系列涵盖了基础的强化学习和规划的序列决策问题,在进入更高级的主题和现代深度RL算法之前。它让学生详细了解各种主题,包括马尔可夫决策过程,基于样本的学习算法(如(双)Q-learning, SARSA),深度强化学习,等等。它还探索了更高级的主题,如非策略学习、多步骤更新和资格跟踪,以及在实现深度强化学习算法(如彩虹DQN)时的概念和实际考虑。

DeepMind研究科学家和工程师Hado van Hasselt, Diana Borsa和Matteo Hessel领导了一份针对硕士以上学生的关于RL和深度RL的13部分独立介绍。

第1讲: 强化学习的介绍

研究科学家Hado van Hasselt介绍了强化学习课程,并解释了强化学习与人工智能的关系。

第二讲: 探索与控制

研究科学家哈多·范·哈塞尔特(Hado van Hasselt)探讨了为什么学习主体同时平衡探索和利用已获得的知识很重要。

第三讲: MDPs与动态规划

研究科学家Diana Borsa解释了如何用动态规划解决MDPs,以提取准确的预测和良好的控制策略。

第4讲: 动态规划算法的理论基础

研究科学家Diana Borsa将动态规划算法作为收缩映射进行研究,观察它们何时以及如何收敛到正确的解。

第五讲:无模型预测

研究科学家Hado van Hasselt对无模型预测及其与蒙特卡罗和时域差分算法的关系进行了更深入的研究。

第6讲:无模型控制

研究科学家Hado van Hasselt研究了策略改进的预测算法,从而产生了可以从抽样经验中学习良好行为策略的算法。

第7讲:函数近似

研究科学家Hado van Hasselt解释了如何将深度学习与强化学习相结合,以实现“深度强化学习”。

第8讲: 规划与模型

研究工程师Matteo Hessel解释了如何学习和使用模型,包括像Dyna和蒙特卡罗树搜索(MCTS)这样的算法。

第9讲: 策略梯度和Actor-Critic方法

研究科学家Hado van Hasselt涵盖了可以直接学习策略的策略算法和结合价值预测以更有效学习的Actor-Critic算法。

第10讲: 近似动态规划

研究科学家Diana Borsa介绍了近似动态规划,探讨了我们可以从理论上说的近似算法的性能。

第11讲: 多步骤和间歇策略

研究科学家Hado van Hasselt讨论了多步和离线策略算法,包括各种减少方差的技术。

第12讲: 深度强化学习#1

研究工程师Matteo Hessel讨论了深度RL的实际考虑和算法,包括如何使用自区分(即Jax)实现这些。

第13讲: 深度强化学习#2

研究工程师Matteo Hessel介绍了作为辅助任务的一般值函数和GVFs,并解释了如何处理算法中的可扩展问题。

成为VIP会员查看完整内容
0
34

这完全修订第二版介绍统计模式识别。一般来说,模式识别涵盖了广泛的问题:它被应用于工程问题,如字符识别和波形分析,以及生物学和心理学的大脑建模。统计决策和估计,这是本书的主要主题,被认为是研究模式识别的基础。这本书是适当的为模式识别的入门课程的文本,并作为在该领域的工作者的参考书。每一章包含计算机项目以及练习。

https://www.elsevier.com/books/introduction-to-statistical-pattern-recognition/fukunaga/978-0-08-047865-4

成为VIP会员查看完整内容
0
34

https://link.springer.com/book/10.1007/978-3-319-55444-0

这本引人入胜的和清晰的书面教科书/参考提供了一个必要的介绍,迅速兴起的跨学科领域的数据科学。它侧重于成为一名优秀的数据科学家的基本原则,以及建立收集、分析和解释数据的系统所需的关键技能。

《数据科学设计手册》是一个实用的见解来源,它突出了分析数据中真正重要的东西,并提供了对如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是着重于重要设计原则的高层讨论。

《数据科学概论》是一门易于阅读的课程,理想情况下,它能满足本科生和早期研究生的需求。它揭示了这门学科如何处于统计学、计算机科学和机器学习的交叉点,具有自己独特的分量和特点。这些和相关领域的从业者会发现这本书非常适合自学。

成为VIP会员查看完整内容
0
32

学习方法的跨学科框架——包括统计学、神经网络和模糊逻辑,本书提供了从数据中学习依赖的原则和方法的统一处理。它建立了一个通用的概念框架,其中可以应用统计学、神经网络和模糊逻辑的各种学习方法,这表明了一些基本原则是当今在统计学、工程学和计算机科学中提出的大多数新方法的基础。书中有一百多幅插图、案例分析和实例,使其成为一本非常有价值的书。

第一部分:概念和理论(第1-4章)。

在第一章的介绍和动机的基础上,我们在第二章给出了归纳学习问题的形式化描述,并介绍了从数据中学习的主要概念和问题。特别地,它描述了一个叫做归纳原理的重要概念。第3章描述了统计中采用的规则化(或惩罚)框架。第四章介绍了Vapnik的统计学习理论(SLT),为有限数据预测学习提供了理论基础。SLT,又名VC理论,对于理解在神经网络、统计和模式识别中开发的各种学习方法,以及开发新的方法,如支持向量机(在第9章中描述)和非归纳学习设置(在第10章中描述)非常重要。

第二部分构造性学习方法(第5-8章)。

这部分描述了回归、分类和密度近似问题的学习方法。目的是展示源于统计、神经网络和信号处理的方法的概念相似性,并讨论它们的相对优势和局限性。只要有可能,我们将构造学习方法与第一部分的概念框架联系起来。第5章描述了各种方法中常用的非线性优化策略。第6章描述了密度近似的方法,包括统计、神经网络和信号处理技术用于数据约简和降维。第7章提供了统计和神经网络回归方法的描述。第8章描述了分类方法。

第三部分: 基于VC的学习方法(第9章和第10章)。

在这里,我们描述了源自VC理论的构造性学习方法。这包括用于几个归纳学习问题的支持向量机(或基于边际的方法)(在第9章)和各种非归纳学习公式(在第10章描述)。

成为VIP会员查看完整内容
0
30

近年来,为顺应新一轮科技革命和产业变革发展趋势,国家提出加快新型基础设施建设并做出一系列决策部署,同时首次将“新基建”写入政府工作报告。新型基础设施更侧重于以信息网络为基础,综合集成新一代信息技术,围绕数据的感知、传输、存储、计算、处理和安全等环节,所形成的基础设施体系对于经济社会数字化发展至关重要,亦有利于加快推动形成国内大循环为主体,国内国际双循环互相促进的新发展格局。因此,“新基建”甫一出场,便引起了社会各界的广泛关注。

中国信息通信研究院作为工业和信息化部直属科研事业单位,在新基建所涉及的5G、人工智能、工业互联网、物联网、数据中心、信息网络等诸多领域拥有长期的研究和丰厚的积淀,在其重大战略、规划、政策、标准和测试认证等方面,为我国信息通信产业的发展提供了有力支撑。为响应国家加快新型基础设施建设的号召,中国信通院聚焦新基建发展中的核心关键问题,依托网络及信息安全、基础设施及产业数据两大优势,聚焦5G、工业互联网、数据中心、新型技术四大核心领域,深耕交通、医疗、金融、能源等融合领域,强化规划咨询、标准研制、试验平台、认证服务、检测评测、应用示范等服务,已经形成了新基建全业务链综合服务能力,迭代更新《新基建产品手册(第四版)》(以下简称《产品手册》)。

成为VIP会员查看完整内容
0
29

看看我们最具影响力的一些科学期刊,比如《新英格兰医学杂志》和《美国医学协会杂志》。在这些期刊或其他高影响因子期刊上发表文章,可能会导致临床实践和政策的重大变化。这些高影响力的出版物有什么共同点? 除了有一个伟大的想法和一个执行良好的研究,他们也有一个清晰和引人注目的叙述,使研究对他们的观众容易理解。有无数重要的科学发现从未意识到它们的潜在影响,因为它们被埋没在写得很差的手稿中。

写一个清晰和引人注目的手稿的重要性不仅仅适用于顶级出版物。即使你是一个经验丰富的作家和研究人员,你的大部分工作也不会出现在这些杂志上。但是你仍然应该以同样的清晰和专注来写作,因为这将增加你的作品的影响力,无论它在哪里出版。你的研究的影响受限于你有效地交流研究结果和工作影响的能力。

也许严肃对待写作最重要的原因不仅仅是手稿。成为一个更有效的作家将教会你如何将复杂的想法表达成有逻辑性和清晰的叙述。这种技能对于学术研究人员经常遇到的其他职责是必要的: 公开演讲、论文写作或机构领导职位。我们指出,写作技能对整体职业发展的可转移性,以帮助你证明为成为一名有效的沟通者所需要的时间是合理的。

本章的其余部分分为两部分。首先,我们概述了科学手稿中应该包含的关键内容的结构。它借鉴了Gil Welch的开创性工作——“为提交医学期刊准备手稿:书面记录”[1]——随着时间的推移,我们已经采用并定制了它。其次,我们提供一些实用的建议,如何提高你的写作过程。这些教训直接来自我们作为作者的学习曲线,我们作为同行评议者的观察,以及与学员一起工作的经验。

论文结构

论文一般包含一下结构:

  • 摘要
  • 介绍
  • 方法
  • 结果
  • 讨论
  • 表和数据

在每个章节中应该包含的细节上,各刊物有所不同。在每本杂志的网站上,你都可以找到“作者说明”,详细说明任何偏离这种格式的地方。下面我们将分别讨论每一节。

摘要 Abstract

什么是摘要? 论文摘要部分是研究文章的摘要(通常不超过300字)。它通常遵循与文章相同的格式(即介绍、方法、结果和结论),但采用缩写形式。

虽然你的主要手稿可能包括多个发现,摘要只有空间集中在一个或两个关键发现。因此,你应该花时间思考哪个是最重要的。花点时间确保你的介绍、方法、结果和结论在摘要中是一致的。例如,你的论文可能会检查多种结果(如并发症、死亡率、成本),但你只打算抽象地关注死亡率和成本。你的介绍、方法、结果和结论都应该针对这两个结果。如果你在摘要中陈述研究了三种结果,但在摘要的结果中只报告了两种,读者会感到非常困惑。

摘要三角色

摘要从你开始写作、提交到发表,有三个不同的角色 (图9.1)。

  1. 写作时: 改进你的研究问题。

  2. 一旦提交:说服编辑这篇论文同行评审的价值。

3.发表后:阅读文章剩余部分指引。

引言 Introduction

引言的目的是为问题提供背景,创造一个知识缺口,并预排你的研究计划。我们觉得用三个不同的段落更有效地做到这一点(图9.2)。

第1段: 给出问题的背景

引言的第一段应该让读者关注主题。它需要让读者快速了解为什么这个主题是重要的。例如,如果你的论文是在评估一项联邦支付政策,你就需要帮助读者快速理解为什么要制定这项政策,以及现在什么是重要的。

第二段: 创造一个知识缺口

第二段需要通过在已知和未知之间创造一个知识缺口沟来引起读者的好奇心。你不应该在这里总结关于这个主题的所有文献,但要强调与你的研究问题有关的紧张或不确定的领域。你在这段中引入的知识缺口应该与你的研究将解决的结果直接相关。

第三段: 预览你的工作计划

引言的第三段应该预览你的工作计划,也就是说,简要说明你将如何弥补在前一段讨论的知识差距。保存方法部分的详细信息,但只需说明将要使用的数据库和结果。同样,结果应该与你刚刚创造的知识差距直接一致。如果你写了前两段正确的动机为什么主题是重要的,突出了有知识差距的领域,那么这段应该是容易写的。

方法

方法部分应该解释研究是如何进行的。对于不同的研究设计(如随机对照试验、调查数据、定性访谈等),在这里需要报道什么有不同的约定。我们建议查看您的目标期刊和/或您的导师以前的文章,以了解这一节是如何组织的。对于许多论文,方法部分将包括以下小节:

数据源——您使用了什么数据?(例如,医疗保险索赔)

患者群体,你研究的是谁?(例如,所有接受结直肠癌手术的患者)

结果——你衡量的是什么?(例如,30天并发症,再入院)

统计分析——你用了什么方法?(如多变量logistic回归)

结果

结果部分详细说明了分析的结果。这应该在多段报告,以描述病人的特征开始。如果适用,下一段应描述被比较群体的医院特征。

讨论

讨论部分是您将前面三个部分(介绍、方法和结果)联系在一起并将它们放入主题的更广泛的上下文中的机会。在这一节中,我们通常使用5段方法,包括4个组件(图9.3)。

成为VIP会员查看完整内容
0
29

计算成像涉及成像硬件和计算机算法的联合设计,以创建具有前所未有能力的新型成像系统。近年来,这些能力包括以每秒一万亿帧的速度运行的摄像机,可以看到长期以来被认为是光学上无法分辨的小病毒的显微镜,以及捕捉黑洞图像的望远镜。这篇文章提供了一个全面和最新的介绍,这是一个迅速发展的领域,视觉,图形,信号处理,和光学的收敛。它可以作为计算机成像课程的教学资源,也可以作为专业人员的参考。

本文首先介绍了一个成像工具包,包括光学、图像传感器和照明,以及一个计算工具包,介绍了建模、数学工具、基于模型的反演、数据驱动的反演技术和混合反演技术。然后它检查光的不同形式,集中在全光功能,它描述了光线的自由度。最后,本文概述了光传输技术,描述了获得微米级三维形状或优化无噪声成像、光学计算和非视线成像的成像系统。在整个过程中,它讨论了计算成像方法在一系列应用领域的使用,包括摄影、自动驾驶和医学成像。章末练习有助于将材料置于上下文中。

https://imagingtext.github.io/

目录内容:

1 Introduction to Computational Imaging

PART I: TOOLKITS

2 Imaging Toolkit

3 Computational Toolkit

II PART II: PLENOPTIC IMAGING

4 Spatially Coded Imaging

5 Temporally Coded Imaging

6 Light Field Imaging and Display

7 Polarimetric Imaging

8 Spectral Imaging

III PART III: SHADING AND TRANSPORT OF LIGHT

9 Programmable Illumination and Shading

10 Light Transport

成为VIP会员查看完整内容
0
27

这是一本不同的信号和系统教科书: 信号和系统的工程应用作为概念和数学模型被集成到演示中,而不是仅仅展示概念和模型,让学生思考它与工程的关系。

本教材的前六章涵盖了连续时间信号和系统的基本概念,包括拉普拉斯变换和傅里叶变换。第7章和第8章给出了第1-6章的离散时间版本,强调了相似点和类比点,并且经常使用连续时间结果来推导离散时间结果。这两章是为了向读者介绍离散时间信号和系统的世界。第1-8章重点介绍的概念包括:补偿器反馈配置(第四章);能谱密度,群延迟,指数傅里叶级数的扩展覆盖(章节5);图像滤波,希尔伯特变换,单边带(SSB),零和一阶保持插值(章节6);Cooley-Tukey FFT(第七章);双边z变换和用于非最小相位反褶积(章节8)。

第9章介绍离散时间信号处理的常用概念,包括数据窗、FIR和IIR滤波器设计、多速率信号处理、自相关和互相关。它还包括一些非传统的概念,包括频谱图、多速率信号处理的应用、音乐五度圈在音频信号处理中的应用,以及自相关和互相关在生物医学中的一些应用。

第10章包括图像处理,离散时间小波(包括Smith-Barnwell条件和Haar和Daubechies离散时间小波展开),以及压缩感知的介绍。这是作者所知的第一本二年级到初中的教科书,允许学生应用压缩感知概念。应用包括:图像去噪使用二维滤波;图像小波变换的阈值化和收缩去噪利用维纳滤波器进行图像反卷积;“有效的”图像反卷积使用ISTA;图像修复;并利用二维DFT值的部分知识进行图像重建。问题允许学生将这些技术应用到实际的图像中,并通过做来学习,而不仅仅是阅读。

https://ss2.eecs.umich.edu/

成为VIP会员查看完整内容
0
27

报告研究团队由布朗大学计算机科学教授Michael L. Littman教授担任团队主席,来自学术界和行业研究实验室的17名成员组成,成员包括计算机科学、工程学、法律学、政治学、政策学、社会学和经济学学者。

与5年前的第一份报告明确侧重于AI在北美城市的影响相比,这次报告的重点是更深入地探讨AI对全球人类和社会的影响。

专业性。报告由该领域核心多学科研究人员组成的研究小组编写——这些专家将创建人工智能算法或研究其对社会的影响作为他们的主要专业活动,并且已经这样做了很多年。作者牢牢扎根于人工智能领域,并提供「内部」视角。

长期性。这是一项长期的纵向研究,报告计划每五年发布一次,持续100年。2021年9月的这份报告是计划中的系列研究中的第二份报告,第一份报告于2016年9月1日发表后,在大众媒体上广为报道,并全球多项人工智能课程中被广泛使用。

本报告的受众主要有四类:

对于一般公众来说,它对人工智能现状及其潜力做出了无障碍、科学和技术准确的描述。

对于工业界来说,报告指出了相关技术和法律和道德上的挑战,可能有助于指导资源配置。

对地方、国家和国际政府来说,报告有助于更好地规划人工智能技术的综合治理。

最后,对于人工智能研究人员和研究机构而言,报告有助于确定研究的优先级,并考虑人工智能研究及其应用提出的经济、道德和法律问题。

成为VIP会员查看完整内容
0
25

如今,随着人们越来越重视个人隐私权、政策法规愈发严格、数据协作和隐私保护矛盾日益凸出,隐私计算已然成为全球新兴的一大产业。

而联邦学习(Federated Learning)作为一种隐私保护的重要解决方案之一,近年来也得到了飞速的发展和足够多的关注。

在今年 7 月发布的 2021 年度Gartner 技术成熟度曲线中,联邦学习被首次纳入“隐私计算的技术成熟度曲线 — 2021”,根据此次 Gartner 预测内容,在 2021-2025 年这一周期中,联邦学习将发挥主流作用,引导该领域的商业化大潮。

近日,清华大学人工智能研究院知识智能中心和清华—中国工程院知识智能联合研究中心和智谱 AI 联合发布了《2021 联邦学习全球研究与应用趋势报告》(以下简称“报告”),报告从科研论文、专利、书籍、行业应用、学者地图与画像、技术发展趋势等多个角度,全景展示和分析了联邦学习技术自从 2016 年被提出以来至 2020 年的重要进展,并展望了该技术的未来发展方向与前景。

主要核心要点如下:

  • 联邦学习科研发展呈现出整体热度逐年上升态势。研究论文产出量以及专利申请受理量均以中美两国为领先主导;全球该领域学者也主要聚集在这两个国家;

  • 联邦学习高被引论文半数以上来自中美两国,两国间的合作论文数量也是全球最多;

  • 联邦学习论文研究和专利申请的热点主要聚焦在机器学习方法、模型训练、隐私保护三方面;

  • 企业比学术机构更积极地开展联邦学习相关研究,不仅在专利申请量前十机构之中占八席,而且引领论文量前十机构,也是联邦学习系统框架的主要推出者;

  • 行业应用研究方向呈现出不断与区块链、物联网、车辆交互、5G等技术融合的态势。

成为VIP会员查看完整内容
0
25

行业、学术界和政府对熟练数据科学从业者的需求正在迅速增长。这本书介绍的概念和技能,可以帮助你解决现实世界的数据分析挑战。它涵盖了概率、统计推断、线性回归和机器学习的概念。它还可以帮助你开发R编程、dplyr数据处理、ggplot2数据可视化、用插入符号构建算法、用UNIX/Linux shell组织文件、用Git和GitHub控制版本、用knitr和R markdown编写可复制的文档。这本书分为六个部分: R,数据可视化,数据争论,概率,推理和回归与R,机器学习和生产力工具。每一部分有几个章节,作为一个讲座。这本书包括几十个练习分布在大多数章节。

成为VIP会员查看完整内容
0
25

这本典型的数据结构课程,介绍了基本的数据结构和算法的集合,可以使用任何不同的编程语言进行教学。近年来,越来越多的学院开始采用Python语言向学生介绍编程和问题解决。与c++和Java等其他语言相比,Python提供了一些优势,其中最重要的是Python有一个简单的语法,更容易学习。本书通过为数据结构课程提供以Python为中心的文本,扩展了Python的使用。该语言干净的语法和强大的特性贯穿始终,但这些特性的底层机制也得到了充分的探索,不仅揭示了“魔力”,而且研究了它们的总体效率。正文由14章和4个附录组成。前四章介绍了与抽象数据类型、数据结构和算法相关的基本概念。后面的章节将在这些早期概念的基础上介绍更高级的主题,并向学生介绍更多的抽象数据类型和更高级的数据结构。这本书包含了几个主题的线索,在整个文本中,主题是重新访问在不同的章节作为适当的。

成为VIP会员查看完整内容
0
24

这本书涵盖了用R总结数据的基本探索性技术。这些技术通常在正式建模开始之前应用,可以帮助开发更复杂的统计模型。探索技术对于消除或强化关于世界的潜在假设也很重要,这些假设可以通过你所拥有的数据来解决。我们将详细介绍R中的绘图系统以及构造信息数据图形的一些基本原则。我们还将介绍一些用于可视化高维数据的常见多元统计技术。

这本书教你使用R来有效地可视化和探索复杂的数据集。探索性数据分析是数据科学过程的一个关键部分,因为它允许您尖锐地提出问题并改进建模策略。这本书是基于行业领先的约翰霍普金斯数据科学专业,最广泛订阅的数据科学培训项目创建。

成为VIP会员查看完整内容
0
24

日前,“2021中国产业互联网与乡村振兴发展论坛暨中国中小企业协会产业互联网专业委员会成立大会”在北京国家会议中心成功召开。会上,清华长三角研究院产业互联网研究中心发布了《2021产业互联网白皮书》。白皮书聚焦于方法论与实践指导特别是运营落地的经验总结上,为处在产业互联网转型过程中的政府领导、产业龙头企业家、行业协会组织者、投资人和广大中小企业提供有价值的参考。 产业互联网是数字时代各垂直产业的新型基础设施,由产业中的骨干企业牵头建设,以共享经济方式提供给产业生态中广大从业者使用。产业互联网通过从整个产业链角度的资源整合和价值链优化,降低整体产业运营成本,提高运营质量与效率,并通过新的产业生态为客户创造更好体验和社会价值。 2020年以来,为支持受疫情影响的中小微企业发展,国家先后出台了支持贸易企业平台化、产业互联网、供应链创新和供应链金融的相关支持政策,助推了产业互联网的发展。与产业互联网3.0时代不同,目前产业链上更多环节正在实现数字化,为全产业链推动产业互联网服务创造了条件,再加上区块链、AI、大数据等新技术应用,让服务更加智能为产业互联网生态发展创造了条件。 白皮书认为,目前互联网发展的主战场已从消费互联网转向产业互联网,这既是国家政策的指引,又是各传统产业发展受困必须转型的现实迫切需求。近年来各垂直产业的产业互联网平台陆续涌现,尤其在农粮、生鲜、钢铁、能源、化工、工业品、汽车汽配等领域。 白皮书指出,通过大量产业互联网的案例研究,所有产业互联网成功实践的背后都有一些共性的经验总结: 产业升级不会带来竞争加剧,而是融合发展与协同共赢。 产业升级的难点不在于技术创新,而在于机制创新。 产业大数据应用将成为产业互联网平台的核心能力。 产业互联网转型是系统工程,专业综合服务或将成为标配。 产业互联网不会形成寡头垄断,但领先者具有先发优势。 产业互联网的特性,决定混合所有制平台公司成为其首选的生 产关系。 产业互联网发展不能急功近利,要有战略定力。 产业互联网的共享价值观与行业治理规则的建立是产业互联网 始终如一的目标。

成为VIP会员查看完整内容
0
23

来自清华大学计算机科学与技术系、中国人民大学信息学院等机构的多位学者深入地研究了预训练模型的历史和发展趋势,并在这篇综述论文中从技术的角度理清了预训练的来龙去脉。

BERT 、GPT 等大规模预训练模型(PTM)近年来取得了巨大成功,成为人工智能领域的一个里程碑。由于复杂的预训练目标和巨大的模型参数,大规模 PTM 可以有效地从大量标记和未标记的数据中获取知识。通过将知识存储到巨大的参数中并对特定任务进行微调,巨大参数中隐式编码的丰富知识可以使各种下游任务受益。现在 AI 社区的共识是采用 PTM 作为下游任务的主干,而不是从头开始学习模型。

本文中,来自清华大学计算机科学与技术系、中国人民大学信息学院等机构的多位学者深入研究了预训练模型的历史,特别是它与迁移学习和自监督学习的特殊关系,揭示了 PTM 在 AI 发展图谱中的重要地位。

论文地址:http://keg.cs.tsinghua.edu.cn/jietang/publications/AIOPEN21-Han-et-al-Pre-Trained%20Models-%20Past,%20Present%20and%20Future.pdf

清华大学教授、悟道项目负责人唐杰表示:这篇 40 多页的预训练模型综述基本上算是从技术上理清了预训练的来龙去脉。

此外,该研究还回顾了 PTM 的最新突破。这些突破得益于算力的激增和数据可用性的增加,目前正在向四个重要方向发展:设计有效的架构、利用丰富的上下文、提高计算效率以及进行解释和理论分析。最后,该研究讨论了关于 PTM 一系列有待解决的问题和研究方向,并且希望他们的观点能够对 PTM 的未来研究起到启发和推动作用。

成为VIP会员查看完整内容
0
21
Top