贝叶斯统计这个名字来源于托马斯·贝叶斯(Thomas Bayes, 1702-1761),一位长老会牧师和业余数学家,他首次推导出了我们现在所知的贝叶斯定理,该定理在1763年(死后)发表。然而,第一个真正发展贝叶斯方法的人是皮埃尔-西蒙·拉普拉斯(1749-1827),因此,也许用拉普拉斯统计学来描述它会更正确一些。尽管如此,我们将尊重斯蒂格勒的同名法则,也将坚持传统,并在本书的其余部分继续讨论贝叶斯方法。从贝叶斯和拉普拉斯(以及其他许多理论)的先驱时代到今天,发生了很多事情——新思想被开发出来,其中许多思想是由计算机激发或使之成为可能的。这本书的目的是为这个主题提供一个现代的视角,从基本原理来构建一个坚实的基础到现代贝叶斯工作流和工具的应用。

https://bayesiancomputationbook.com/welcome.html

我们写这本书是为了帮助贝叶斯初学者成为中级建模者。我们并不是说这在你读完这本书后就会自动发生,但我们希望这本书能引导你走向一个富有成效的方向,特别是如果你彻底阅读它,做练习,应用书中的思想到你自己的问题,并继续从别人那里学习。

特别指出,这本书的目标读者是对应用贝叶斯模型解决数据分析问题感兴趣的贝叶斯从业人员。通常学术界和工业界是有区别的。

我们的目的是在本书完成后,您不仅会熟悉贝叶斯推理,而且会对贝叶斯模型进行探索性分析,包括模型比较、诊断、评估和结果的交流。这也是我们的意图,从现代和计算的角度来教授所有这一切。对我们来说,如果我们采用计算的方法,贝叶斯统计可以更好地理解和应用,这意味着,例如,我们更关心经验检验我们的假设是如何被违反的,而不是试图证明假设是正确的。这也意味着我们使用许多可视化。建模方法的其他含义将随着页面的进展而变得清晰。

最后,正如书名中所述,我们在本书中使用Python编程语言。更具体地说,我们将主要关注PyMC3[1]和TensorFlow Probability (TFP)[2],作为模型构建和推理的主要概率编程语言(pls),并使用ArviZ作为主要的库来探索性分析贝叶斯模型[3]。在本书中,我们不打算对所有Python ppl进行详尽的调研和比较,因为有很多选择,而且它们发展得很快。我们将重点放在贝叶斯分析的实际方面。编程语言和库只是我们到达目的地的桥梁。

尽管本书选择的编程语言是Python,其中选择的库很少,但我们所涉及的统计和建模概念是语言和库无关的,在许多计算机编程语言中都可以使用,比如R、Julia和Scala等等。具有这些语言知识但不了解Python的积极读者仍然可以从这本书中受益,特别是如果他们找到了支持他们所选择语言中等效功能的合适包或代码,以获得实际实践。此外,作者还鼓励其他人将本文中的代码示例翻译成其他语言或框架。如果您愿意,请与我们联系。

第一章提供了对贝叶斯推理的基本和中心概念的复习或快速介绍。本章中的概念将在本书的其余部分重新讨论和应用。

第二章介绍了贝叶斯模型的探索性分析。也就是说,引入了贝叶斯工作流中的许多概念,但这些概念本身并不是推理。在本书的其余部分中,我们将应用和重温本章中的概念。

第三章是专门介绍了一个特定的模型体系结构。它提供了线性回归模型的介绍,并为接下来的五章建立了基本的基础。第三章还全面介绍了本书中使用的主要概率编程语言PyMC3和TensorFlow Probability。

第四章扩展了线性回归模型,并讨论了更高级的主题,如稳健回归、层次模型和模型重参数化。本章使用PyMC3和TensorFlow Probability。

第五章介绍了基函数,特别是作为线性模型扩展的样条,它允许我们构建更灵活的模型。本章使用PyMC3。

第六章重点介绍时间序列模型,从时间序列的回归建模到更复杂的模型,如ARIMA和线性高斯状态空间模型。本章使用TensorFlow Probability。

第七章介绍了贝叶斯可加回归树的非参数模型。我们讨论了这个模型的可解释性和可变重要性。本章使用PyMC3。

第八8章将关注近似贝叶斯计算(ABC)框架,它对于我们没有明确的可能性公式的问题是有用的。本章使用PyMC3。

第九章对端到端贝叶斯工作流进行了概述。它展示了商业环境中的观察性研究和研究环境中的实验性研究。本章使用PyMC3。

第十章深入探讨了概率编程语言。本章将介绍各种不同的概率编程语言。

成为VIP会员查看完整内容
0
39

相关内容

数据科学不仅仅是机器学习和统计学,也不仅仅是预测。但有一件事我们可以非常自信地断言,数据科学始终与数据有关。本书的目的有两方面:

我们专注于数据科学的支柱: 数据。

我们使用Julia编程语言来处理数据。

有许多编程语言,每一种都有自己的优点和缺点。有些语言非常快,但很冗长。其他语言很容易写,但很慢。这就是所谓的两种语言问题,Julia的目标是解决这个问题。尽管我们三个人来自不同的领域,但我们都发现朱莉娅的语言在我们的研究中比我们以前使用过的语言更有效。我们将在第二节讨论我们的一些论点。然而,与其他语言相比,Julia 是一种最新的语言。这意味着围绕语言的生态系统有时很难驾驭。很难弄清楚从哪里开始,以及如何将所有不同的包组合在一起。这就是为什么我们决定创作这本书!我想让研究人员,尤其是我们的同事,更容易开始使用这门很棒的语言。如上所述,每种语言都有其优缺点。在我们看来,数据科学绝对是Julia的强项。与此同时,我们三个人都在日常生活中使用数据科学工具。而且,你可能也想使用数据科学!这就是为什么本书将重点放在数据科学上。在本节的下一部分,我们强调数据科学的“数据”部分,以及为什么数据技能是,并将继续在工业和学术界的高需求。我们主张将软件工程实践纳入数据科学,这将减少与合作者更新和共享代码时的摩擦。大多数数据分析都需要合作;这就是为什么这些软件实践将帮助您。

成为VIP会员查看完整内容
0
22

这本书的目的是讲述当今世界各地研究人员使用的统计学的故事。这是一个不同的故事,在大多数介绍性的统计书籍,重点教如何使用一套工具,以实现非常具体的目标。这本书的重点在于理解统计思维的基本思想——一种关于我们如何描述世界、如何使用数据做出决定和预测的系统思维方式,所有这些都存在于现实世界的内在不确定性的背景下。它还带来了当前的方法,这些方法只有在过去几十年中计算能力的惊人增长才变得可行。在20世纪50年代需要数年时间才能完成的分析,现在在一台标准的笔记本电脑上只需几秒钟就能完成,这种能力释放了利用计算机模拟以新的、强大的方式提出问题的能力。

这本书也是在2010年以来席卷了许多科学领域的再现危机之后写成的。这场危机的一个重要根源在于,研究人员一直在使用(和滥用)统计假设检验(我将在本书的最后一章详细说明),这直接与统计教育有关。因此,本书的目标是突出当前统计方法可能存在的问题,并提出替代方案。

https://statsthinking21.github.io/statsthinking21-core-site/

成为VIP会员查看完整内容
0
49

本书通过使用Python的案例研究来探索数据分析和统计的基础知识。这本书将向你展示如何自信地用Python编写代码,以及如何使用各种Python库和函数来分析任何数据集。该代码在Jupyter 笔记本中提出,可以进一步调整和扩展。

这本书分为三个部分——用Python编程,数据分析和可视化,以及统计。首先介绍Python——语法、函数、条件语句、数据类型和不同类型的容器。然后,您将回顾更高级的概念,如正则表达式、文件处理和用Python解决数学问题。

本书的第二部分将介绍用于数据分析的Python库。将有一个介绍性的章节涵盖基本概念和术语,和一个章节的NumPy(科学计算库),NumPy(数据角力库)和可视化库,如Matplotlib和Seaborn。案例研究将包括作为例子,以帮助读者理解一些实际应用的数据分析。

本书的最后几章集中在统计学上,阐明了与数据科学相关的统计学的重要原则。这些主题包括概率、贝叶斯定理、排列和组合、假设检验(方差分析、卡方检验、z检验和t检验),以及Scipy库如何简化涉及统计的繁琐计算。

你会: 进一步提高你的Python编程和分析技能 用Python解决微积分、集合论和代数中的数学问题 使用Python中的各种库来结构化、分析和可视化数据 使用Python进行实际案例研究 回顾基本的统计概念,并使用Scipy库来解决统计方面的问题

成为VIP会员查看完整内容
0
60

这新版本的教科书/参考提供了从工程的角度对概率图模型(PGMs)的介绍。它提供了关于马尔科夫决策过程、图模型和深度学习的新材料,以及更多的练习。

这本书涵盖了PGM的每个主要类的基础知识,包括表示、推理和学习原理,并回顾了每种类型的模型的实际应用。这些应用来自广泛的学科,突出了贝叶斯分类器、隐藏马尔可夫模型、贝叶斯网络、动态和时间贝叶斯网络、马尔可夫随机场、影响图和马尔可夫决策过程的许多使用。

概率图模型(PGMs)及其在不确定性下进行智能推理的应用出现于20世纪80年代的统计和人工智能推理领域。人工智能的不确定性(UAI)会议成为这一蓬勃发展的研究领域的首要论坛。20岁的时候,我在圣何塞的UAI-92大学第一次见到了恩里克·苏卡——我们都是研究生——在那里,他展示了他关于高层次视觉推理的关系和时间模型的研究成果。在过去的25年里,Enrique对我们的领域做出了令人印象深刻的研究贡献,从客观概率的基础工作,到开发时态和事件贝叶斯网络等高级形式的PGMS,再到PGMS的学习,例如,他的最新研究成果是用于多维分类的贝叶斯链分类器。

概率图模型作为一种强大而成熟的不确定性推理技术已被广泛接受。与早期专家系统中采用的一些特殊方法不同,PGM基于图和概率论的强大数学基础。它们可用于广泛的推理任务,包括预测、监测、诊断、风险评估和决策。在开源软件和商业软件中有许多有效的推理和学习算法。此外,它们的力量和功效已通过其成功应用于大量现实世界的问题领域而得到证明。Enrique Sucar是PGM作为实用和有用技术建立的主要贡献者,他的工作跨越了广泛的应用领域。这些领域包括医学、康复和护理、机器人和视觉、教育、可靠性分析以及从石油生产到发电厂的工业应用。

成为VIP会员查看完整内容
0
99

前言 在这本书中,我们从图形模型的基础知识、它们的类型、为什么使用它们以及它们解决了什么类型的问题开始。然后我们在图形模型的上下文中探索子问题,例如它们的表示、构建它们、学习它们的结构和参数,以及使用它们回答我们的推理查询。

这本书试图提供足够的理论信息,然后使用代码示例窥视幕后,以了解一些算法是如何实现的。代码示例还提供了一个方便的模板,用于构建图形模型和回答概率查询。在文献中描述的许多种类的图形模型中,这本书主要关注离散贝叶斯网络,偶尔也有来自马尔科夫网络的例子。

内容概述

  • 第一章:概率论,涵盖了理解图形模型所需的概率论的概念。

  • 第2章:有向图形模型,提供了关于贝叶斯网络的信息,他们的属性相关的独立性,条件独立性,和D分离。本章使用代码片段加载贝叶斯网络并理解其独立性。

  • 第三章:无向图模型,介绍了马尔可夫网络的性质,马尔可夫网络与贝叶斯网络的区别,以及马尔可夫网络的独立性。

  • 第四章:结构学习,涵盖了使用数据集来推断贝叶斯网络结构的多种方法。我们还学习了结构学习的计算复杂性,并在本章使用代码片段来学习抽样数据集中给出的结构。

  • 第5章:参数学习,介绍了参数学习的最大似然法和贝叶斯方法。

  • 第6章:使用图形模型的精确推理,解释了精确推理的变量消除算法,并探索了使用相同算法回答我们的推理查询的代码片段。

  • 第7章:近似推理方法,探讨了网络太大而无法进行精确推理的近似推理。我们还将通过在马尔科夫网络上使用循环信念传播运行近似推论的代码样本。

目录

成为VIP会员查看完整内容
0
83

本书建立在基本的Python教程的基础上,解释了许多没有被常规覆盖的Python语言特性:从通过利用入口点作为微服务扮演双重角色的可重用控制台脚本,到使用asyncio高效地整理大量来源的数据。通过这种方式,它涵盖了基于类型提示的linting、低开销测试和其他自动质量检查,以演示一个健壮的实际开发过程。

Python的一些功能强大的方面通常用一些设计的示例来描述,这些示例仅作为一个独立示例来解释该特性。通过遵循从原型到生产质量的真实应用程序示例的设计和构建,您不仅将看到各种功能是如何工作的,而且还将看到它们如何作为更大的系统设计过程的一部分进行集成。此外,您还将受益于一些有用的附加说明和库建议,它们是Python会议上问答会议的主要内容,也是讨论现代Python最佳实践和技术的主要内容,以便更好地生成易于维护的清晰代码。

高级Python开发是为已经能用Python编写简单程序的开发人员准备的,这些开发人员希望了解什么时候使用新的和高级语言特性是合适的,并且能够以一种自信的方式这样做。它对于希望升级到更高级别的开发人员和迄今为止使用过较老版本Python的非常有经验的开发人员特别有用。

你将学习

  • 理解异步编程
  • 检查开发插件架构
  • 使用类型注释
  • 回顾测试技术
  • 探索打包和依赖项管理

这本书是给谁的 -已经有Python经验的中高级开发人员。

成为VIP会员查看完整内容
0
168

这本书以一种结构化的、直观的、友好的方式学习c++编程语言。这本书教授现代c++编程语言、c++标准库和现代c++标准的基础知识。不需要以前的编程经验。

c++是一种不同于其他语言的语言,它的复杂性令人惊讶,但在许多方面都非常优美和优雅。它也是一种不能通过猜测来学习的语言,是一种很容易出错的语言。为了克服这一点,每个部分都充满了现实世界中逐渐增加复杂性的例子。面向绝对初学者的现代c++教的不仅仅是用c++ 20编程。它提供了一个可在其上进行构建的坚实的c++基础。

作者带您了解c++编程语言、标准库和c++ 11到c++ 20标准基础知识。每一章都附有适量的理论和大量的源代码示例。

您将使用c++ 20个特性和标准,同时还将比较和查看以前的c++版本。您将使用大量相关的源代码示例来实现此目的。

你将学到什么

  • 使用c++的基础:类型、操作符、变量、常量、表达式、引用、函数、类、I/O、智能指针、多态性等等
  • 在Windows上设置Visual Studio环境,在Linux上设置GCC环境,这样就可以编写自己的代码
  • 声明和定义函数、类和对象,并将代码组织到名称空间中
  • 发现面向对象编程:类和对象,封装,继承,多态性,以及更多使用最先进的c++特性
  • 在组织源代码和控制程序工作流方面采用最佳实践
  • 熟悉c++语言的dos和donts等等
  • 掌握基本的lambdas、继承、多态性、智能指针、模板、模块、契约、概念等等

这本书是给谁的

  • 希望学习c++编程的初学者或程序员新手。不需要有编程经验。
成为VIP会员查看完整内容
0
105

Python Workout提供了50个练习,重点是Python 3的关键特性。在这本书中,Python专家教练鲁文·勒纳(Reuven Lerner)通过一系列小项目指导你,练习你处理日常任务所需的技能。你会喜欢每个技巧的清晰解释,你可以观看Reuven解决每个练习的视频。

https://www.manning.com/books/python-workout

在过去的几年中,Python已经进入了许多领域,包括系统管理、数据科学、devops、文本处理和Web开发。因此,现在有许多课程和书籍旨在教授Python。

本书分为10章,每一章涵盖Python的不同领域。总的来说,随着本书的发展,问题会变得越来越复杂——但这并不意味着我要等到“函数”一章才开始使用函数,或者等到“函数编程”一章才开始理解函数。你可以使用任何你认为必要的工具。

每一章都以一个参考表开始,包括链接,指向可能帮助你更好地理解你已经忘记或从未学过的主题的资源。我希望这些将帮助您加强对Python的理解,而不仅仅是本书本身。

除了练习和解决方案,还有视频,在其中我演示如何解决每个问题,并添加到我在书中的讨论。解决方案和你在书中读到的一样,但对很多人来说,视频让整个过程更加生动;你会在我的现场培训课程中得到更多的感觉。此外,查看编码和解决过程的时间变化通常很有帮助,而不是在页面上一次性查看所有内容。使用视频片段的最佳方法是同时打开该书和视频(在Manning的liveVideo平台中)。对于每个练习,从书开始,完成每个练习,如果你喜欢,阅读解决方案和讨论。然后点击相应的视频片段,看我演示解决方案,并为讨论提供进一步的见解。

成为VIP会员查看完整内容
0
66

首先加速介绍R生态系统、编程语言和工具,包括R脚本和RStudio。通过使用许多例子和项目,这本书教你如何将数据导入R,以及如何使用R处理这些数据。一旦基础扎实,《实用R 4》的其余部分将深入具体的项目和例子,从使用R和LimeSurvey运行和分析调查开始。接下来,您将使用R和MouselabWeb执行高级统计分析。然后,您将看到在没有统计信息的情况下R如何工作,包括如何使用R自动化数据格式化、操作、报告和自定义函数。

本书的最后一部分讨论了在服务器上使用R;您将使用R构建一个脚本,该脚本可以运行RStudio服务器并监视报表源的更改,以便在发生更改时向用户发出警报。这个项目包括定期电子邮件提醒和推送通知。最后,您将使用R创建一个定制的个人最重要信息的每日纲要报告,例如天气报告、每日日历、待办事项等等。这演示了如何自动化这样一个过程,以便用户每天早上导航到相同的web页面并获得更新的报告。

你将学到什么

  • 设置并运行R脚本,包括在新机器上的安装以及下载和配置R
  • 使用RStudio Server将任何机器变成可从任何地方访问的强大数据分析平台
  • 编写基本的脚本并修改现有的脚本以满足自己的需要。
  • 在R中创建基本的HTML报告,根据需要插入信息
  • 构建一个基本的R包并发布它

这本书是给谁的

  • 建议您之前接触过统计学、编程和SAS,但不是必需的。
成为VIP会员查看完整内容
0
66

使用Microsoft Excel中流行的数据挖掘技术,更好地理解机器学习方法。

软件工具和编程语言包接受数据输入并直接交付数据挖掘结果,对工作机制没有任何见解,并在输入和输出之间造成了鸿沟。这就是Excel可以提供帮助的地方。

Excel允许您以透明的方式处理数据。当您打开一个Excel文件时,数据立即可见,您可以直接使用它。在执行挖掘任务时,可以检查中间结果,从而更深入地理解如何操作数据和获得结果。这些是隐藏在软件工具和编程语言包中的模型构建过程的关键方面。

这本书教你通过Excel进行数据挖掘。您将了解当数据集不是很大时Excel在数据挖掘方面的优势。它可以为您提供数据挖掘的可视化表示,在结果中建立信心。您将手动完成每一个步骤,这不仅提供了一个主动学习体验,而且还告诉您挖掘过程是如何工作的,以及如何发现数据内部隐藏的模式。

你将学到什么

  • 使用可视化的一步一步的方法理解数据挖掘
  • 首先从理论上介绍了一种数据挖掘方法,然后是Excel的实现
  • 揭开机器学习算法背后的神秘面纱,让每个人都能接触到一个复杂的话题
  • 熟练使用Excel公式和函数
  • 获得数据挖掘和Excel的实际操作经验

这本书是给谁的

  • 任何对学习数据挖掘或机器学习感兴趣的人,特别是数据科学视觉学习者和擅长Excel的人,希望探索数据科学主题和/或扩展他们的Excel技能的人。建议对Excel有基本或初级的了解。
成为VIP会员查看完整内容
0
63
小贴士
相关VIP内容
专知会员服务
22+阅读 · 2021年11月4日
专知会员服务
49+阅读 · 2021年10月17日
专知会员服务
99+阅读 · 2021年5月26日
【干货书】用Python构建概率图模型,173页pdf
专知会员服务
83+阅读 · 2020年8月23日
专知会员服务
168+阅读 · 2020年7月31日
专知会员服务
105+阅读 · 2020年7月24日
专知会员服务
66+阅读 · 2020年7月1日
专知会员服务
63+阅读 · 2020年6月28日
相关论文
Rosalia Tufano,Simone Masiero,Antonio Mastropaolo,Luca Pascarella,Denys Poshyvanyk,Gabriele Bavota
0+阅读 · 1月18日
Lea M. Versbach,Viktor Linders,Robert Klöfkorn,Philipp Birken
0+阅读 · 1月15日
Fernando Moreno-Pino,Emese Sükei,Pablo M. Olmos,Antonio Artés-Rodríguez
0+阅读 · 1月12日
Leixian Shen,Enya Shen,Yuyu Luo,Xiaocong Yang,Xuming Hu,Xiongshuai Zhang,Zhiwei Tai,Jianmin Wang
9+阅读 · 2021年9月8日
Diverse Video Captioning Through Latent Variable Expansion with Conditional GAN
Huanhou Xiao,Jinglun Shi
3+阅读 · 2020年3月5日
Semantics of Data Mining Services in Cloud Computing
Manuel Parra-Royon,Ghislain Atemezing,J. M. Benítez
4+阅读 · 2018年10月5日
N. Majumder,D. Hazarika,A. Gelbukh,E. Cambria,S. Poria
11+阅读 · 2018年6月16日
Rem Hida,Naoya Takeishi,Takehisa Yairi,Koichi Hori
7+阅读 · 2018年5月6日
Yuan-Ting Hu,Jia-Bin Huang,Alexander G. Schwing
5+阅读 · 2018年3月29日
Top
微信扫码咨询专知VIP会员