软件已经成为当代生活的一个关键组成部分,而对任何符合数字形式的东西进行排名、分类或推荐的算法技术无处不在。这本书在概念上和历史上接近信息排序的领域。以Gilbert Simondon的哲学和文化技术传统为基础,它首先考察了软件的建设性和累积性特征,并展示了软件制作如何不断利用现有知识和技术的大量储备。然后,它重建了一系列算法技术的历史轨迹,这些技术实际上已经成为当代秩序实践的基石。坐标索引、文本处理、机器学习和网络算法是相对于几个世纪的图书馆传统而发展起来的,它们实例化了动态的、视角主义的、感兴趣的安排信息、思想或人员的形式。在技术基础设施和经济逻辑的包围下,这些技术已经成为改变空间的有序引擎。

成为VIP会员查看完整内容
0
35

相关内容

我的目标是撰写一本既可以作为教程又能够参考的书。这本书最初是为我在Mount St. Mary大学的编程入门课上的学生准备的大约30页笔记。这些学生中大多数没有编程经验,这促使我改进方法。我省略了很多技术细节,有时我过度简化了事情。其中一些细节在书的后面被补充,尽管其他细节从未被补充。但是这本书并不打算涵盖所有内容,我推荐阅读其他书籍和Python文档来填补这些空白。

这本书第一部分的大部分内容都是基础。前四章非常重要。第五章是有用的,但不是所有的都是关键的。第6章(字符串)应该在第7章(列表)之前完成。第8章包含一些更高级的列表主题。虽然这些内容都很有趣,也很有用,但大部分内容都可以跳过。特别是,那一章涵盖了列表理解,我在书中后面会大量使用。虽然您可以不使用列表理解,但它们提供了一种优雅而有效的做事方式。第9章(while循环)很重要。第10章包含了各种各样的主题,它们都很有用,但是如果需要的话,可以跳过很多。第一部分的最后四章是关于字典、文本文件、函数和面向对象编程的。

第二部分是关于图形的,主要是用Tkinter进行GUI编程。您可以很快地使用Tkinter编写一些很好的程序。例如,第15.7节呈现了一款20行的井字游戏。第二部分的最后一章介绍了一些关于Python图像库的内容。

第三部分包含了许多您可以用Python做的有趣的事情。如果你要围绕这本书组织一个学期的课程,你可能想在第三部分中选择一些主题来复习。这本书的这一部分也可以作为一个参考或作为一个地方,有兴趣和积极的学生学习更多。书中这一部分的所有主题都是我在某一点或另一点上发现有用的东西。虽然这本书是为入门编程课程而设计的,但是对于那些有编程经验想要学习Python的人来说,这本书也很有用。如果你是这些人中的一员,你应该能够轻松地读完前几章。您应该发现,第2部分对GUI编程进行了简明而非肤浅的论述。第三部分包含了关于Python特性的信息,这些特性允许您用很少的代码完成大任务。

成为VIP会员查看完整内容
0
25

近年来,图论已经成为一个重要的数学工具在广泛的学科,从运筹学和化学到遗传学和语言学,从电气工程和地理学到社会学和建筑学。与此同时,它本身也成为一门有价值的数学学科。鉴于此,有必要编写一份廉价的关于这一主题的介绍性文本,既适合学习图论课程的数学家,也适合希望尽快学习这一主题的非专业人士。我希望这本书能在某种程度上满足这一需求。阅读它的唯一先决条件是初等集合理论和矩阵理论的基本知识,尽管抽象代数的进一步知识需要更困难的练习。

这本书的内容可以很方便地分为四部分。第一部分(1-4章)提供了一个基本的基础课程,包括图的定义和例子,连通性,欧拉和哈密顿路径和循环,以及树。接下来是关于平面性和着色的两章(第5章和第6章),特别提到了四色定理。第三部分(第7章和第8章)讨论有向图理论和截线理论,以及在关键路径分析、马尔可夫链和网络流中的应用。书的最后一章是关于matroids的(第9章),这一章将前几章的材料联系在一起,并介绍了一些最近的发展。

成为VIP会员查看完整内容
0
34

高维概率提供了对随机向量、随机矩阵、随机子空间和用于量化高维不确定性的对象的行为的洞察。借鉴了概率、分析和几何的思想,它适用于数学、统计学、理论计算机科学、信号处理、优化等领域。它是第一个将高维概率的理论、关键工具和现代应用集成起来的。集中不等式是其核心,它涵盖了Hoeffding和Chernoff等经典不等式和Bernstein等现代发展。然后介绍了基于随机过程的强大方法,包括Slepian的、Sudakov的和Dudley的不等式,以及基于VC维的泛链和界。整本书包含了大量的插图,包括经典和现代的协方差估计、聚类、网络、半定规划、编码、降维、矩阵补全、机器学习、压缩感知和稀疏回归等结果。

这是一本教科书在高维概率与数据科学的应用展望。它是为博士和高级硕士学生和数学,统计,电子工程,计算机科学,计算生物学和相关领域的初级研究人员,谁正在寻求扩大他们的理论方法在现代研究数据科学的知识。

成为VIP会员查看完整内容
0
27

本书通过有监督、无监督和高级学习技术提供了对机器学习算法的概念理解。本书包括四个部分:基础、监督学习、非监督学习和高级学习。第一部分提供了基础材料、背景和简单的机器学习算法,为学习机器学习算法做准备。第二部分和第三部分提供了对监督学习算法和作为核心部分的无监督学习算法的理解。最后一部分提供了先进的机器学习算法:集成学习、半监督学习、时序学习和强化学习。

提供两种学习算法的全面覆盖: 监督和无监督学习; 概述用于解决分类、回归和聚类的计算范例; 具有构建新一代机器学习的基本技术。

这本书是关于机器学习的概念,理论和算法。在第一部分中,我们通过探索学习理论、评估方案和简单的机器学习算法,提供了关于机器学习的基本知识。在第二和第三部分中,我们将监督学习算法描述为分类和回归任务的方法,而无监督学习算法描述为聚类任务的方法。在第四部分,我们讨论了特殊类型的学习算法,并将监督算法和非监督算法的混合作为进一步的研究。读者需要线性代数和向量微积分的基本知识来理解机器学习算法,其中输入数据总是以数字向量的形式给出。

成为VIP会员查看完整内容
0
57

《数据科学设计手册》提供了实用的见解,突出了分析数据中真正重要的东西,并提供了如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是专注于重要设计原则的高级讨论。这个易于阅读的文本理想地服务于本科生和早期研究生的需要,开始“数据科学入门”课程。它揭示了这门学科是如何以其独特的分量和特点,处于统计学、计算机科学和机器学习的交叉领域。在这些和相关领域的从业者会发现这本书完美的自学以及。

《数据科学设计手册》是数据科学的介绍,重点介绍建立收集、分析和解释数据的系统所需的技能和原则。作为一门学科,数据科学位于统计学、计算机科学和机器学习的交汇处,但它正在构建自己独特的分量和特征。

这本书涵盖了足够的材料在本科或早期研究生水平的“数据科学入门”课程。在这里可以找到教学这门课程的全套讲课幻灯片,以及项目和作业的数据资源,以及在线视频讲座。

成为VIP会员查看完整内容
0
37

本课程涵盖了每个专业程序员需要了解的关于算法和数据结构的基本信息,重点是应用程序和Java实现的科学性能分析。第一部分介绍基本的数据结构、排序和搜索算法。第二部分重点介绍图形和字符串处理算法。

https://algs4.cs.princeton.edu/

《算法(第四版》是普林斯顿超级大神教授Robert Sedgewick的神作,该书还有配套的MOOC课程,是算法领域经典的参考书。

这本书涵盖所有程序员必须掌握的50种算法,全面介绍了关于算法和数据结构的必备知识,并特别针对排序、搜索、图处理和字符串处理进行了论述。第4版具体给出了每位程序员应知应会的50个算法,提供了实际代码,而且这些Java代码实现采用了模块化的编程风格,读者可以方便地加以改造。

成为VIP会员查看完整内容
0
53

这是一本专门为计算机科学学生设计的数学概率和统计课程的教科书。计算机科学的例子在整个领域被使用,例如:计算机网络;数据和文本挖掘;计算机安全;遥感;计算机性能评价;软件工程;数据管理;等。

为什么这本书不同于所有其他关于数学概率和统计的书?

首先,它强烈强调直觉,较少数学形式主义。根据我的经验,通过样本空间定义概率(标准方法)是做好应用工作的主要障碍。将期望值定义为加权平均值也是如此。相反,我使用一种直观、非正式的方法,即长期频率和长期平均值。我相信这在解释条件概率和期望时特别有用,这些概念往往是学生们难以理解的。(他们通常认为自己理解了,直到他们实际上必须使用这些概念来解决一个问题。)另一方面,尽管相对缺乏形式主义,所有的模型等都被精确地用随机变量和分布来描述。这部分内容实际上比这一层次上的大部分内容都更具有数学意义因为它广泛地使用了线性代数。

第二,这本书强调了现实世界的应用。类似的课本,尤其是Mitzenmacher写的那本优雅有趣的计算机科学学生的书,侧重于概率,事实上是离散概率。他们预期的“应用”类别是算法的理论分析。相反,我关注的是这些材料在现实世界中的实际使用;它更倾向于连续而不是离散,更倾向于统计领域而不是概率。鉴于“大数据”和机器学习如今在计算机应用中发挥着重要作用,这一点应被证明尤其有价值。

第三,非常强调建模。相当多的重点放在这样的问题上:在现实生活中,概率模型的真正含义是什么?如何选择模型?我们如何评估模型的实用价值?这方面非常重要,因此有一个单独的章节,叫做模型构建导论。贯穿全文,有相当多的讨论的现实意义的概率概念。

成为VIP会员查看完整内容
0
46

这本教科书通过提供实用的建议,使用直接的例子,并提供相关应用的引人入胜的讨论,以一种容易理解的方式介绍了基本的机器学习概念。主要的主题包括贝叶斯分类器,最近邻分类器,线性和多项式分类器,决策树,神经网络,和支持向量机。后面的章节展示了如何通过“推进”的方式结合这些简单的工具,如何在更复杂的领域中利用它们,以及如何处理各种高级的实际问题。有一章专门介绍流行的遗传算法。

这个修订的版本包含关于工业中机器学习的实用应用的关键主题的三个全新的章节。这些章节研究了多标签域,无监督学习和它在深度学习中的使用,以及归纳逻辑编程的逻辑方法。许多章节已经被扩展,并且材料的呈现已经被增强。这本书包含了许多新的练习,许多解决的例子,深入的实验,和独立工作的计算机作业。

https://link.springer.com/book/10.1007/978-3-319-63913-0#about

成为VIP会员查看完整内容
0
136

获得高级数据分析概念的广泛基础,并发现数据库中的最新革命,如Neo4j、Elasticsearch和MongoDB。这本书讨论了如何实现ETL技术,包括主题爬行,这是应用在诸如高频算法交易和面向目标的对话系统等领域。您还将看到机器学习概念的示例,如半监督学习、深度学习和NLP。使用Python的高级数据分析还包括时间序列和主成分分析等重要的传统数据分析技术。

读完这本书,你将对分析项目的每个技术方面都有了经验。您将了解使用Python代码的概念,并提供在您自己的项目中使用的示例。

你会学到什么

  • 使用数据分析技术,如分类、聚类、回归和预测
  • 处理结构化和非结构化数据、ETL技术以及不同类型的数据库,如Neo4j、Elasticsearch、MongoDB和M- ySQL
  • 考察不同的大数据框架,包括Hadoop和Spark
  • 发现先进的机器学习概念,如半监督学习,深度学习,和NLP

这本书是给谁看的

对数据分析领域感兴趣的数据科学家和软件开发人员。

成为VIP会员查看完整内容
0
103

本书概述了现代数据科学重要的数学和数值基础。特别是,它涵盖了信号和图像处理(傅立叶、小波及其在去噪和压缩方面的应用)、成像科学(反问题、稀疏性、压缩感知)和机器学习(线性回归、逻辑分类、深度学习)的基础知识。重点是对方法学工具(特别是线性算子、非线性逼近、凸优化、最优传输)的数学上合理的阐述,以及如何将它们映射到高效的计算算法。

https://mathematical-tours.github.io/book/

它应该作为数据科学的数字导览的数学伴侣,它展示了Matlab/Python/Julia/R对这里所涵盖的所有概念的详细实现。

成为VIP会员查看完整内容
0
211
小贴士
相关主题
相关VIP内容
相关论文
Angelo Alberto Casulli,Igor Simunec
0+阅读 · 7月26日
Yanci Zhang,Tianming Du,Yujie Sun,Lawrence Donohue,Rui Dai
0+阅读 · 7月26日
Heng Yang,Wei Dong,Luca Carlone,Vladlen Koltun
16+阅读 · 3月4日
CSKG: The CommonSense Knowledge Graph
Filip Ilievski,Pedro Szekely,Bin Zhang
15+阅读 · 2020年12月21日
A Survey on Bayesian Deep Learning
Hao Wang,Dit-Yan Yeung
42+阅读 · 2020年7月2日
Bang Liu,Weidong Guo,Di Niu,Jinwen Luo,Chaoyue Wang,Zhen Wen,Yu Xu
6+阅读 · 2020年4月5日
Qingyu Guo,Fuzhen Zhuang,Chuan Qin,Hengshu Zhu,Xing Xie,Hui Xiong,Qing He
78+阅读 · 2020年2月28日
TinyBERT: Distilling BERT for Natural Language Understanding
Xiaoqi Jiao,Yichun Yin,Lifeng Shang,Xin Jiang,Xiao Chen,Linlin Li,Fang Wang,Qun Liu
8+阅读 · 2019年9月23日
Kamran Kowsari,Kiana Jafari Meimandi,Mojtaba Heidarysafa,Sanjana Mendu,Laura E. Barnes,Donald E. Brown
11+阅读 · 2019年6月25日
DSKG: A Deep Sequential Model for Knowledge Graph Completion
Lingbing Guo,Qingheng Zhang,Weiyi Ge,Wei Hu,Yuzhong Qu
3+阅读 · 2018年12月30日
Top