监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。 监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。

VIP内容

本书通过有监督、无监督和高级学习技术提供了对机器学习算法的概念理解。本书包括四个部分:基础、监督学习、非监督学习和高级学习。第一部分提供了基础材料、背景和简单的机器学习算法,为学习机器学习算法做准备。第二部分和第三部分提供了对监督学习算法和作为核心部分的无监督学习算法的理解。最后一部分提供了先进的机器学习算法:集成学习、半监督学习、时序学习和强化学习。

提供两种学习算法的全面覆盖: 监督和无监督学习; 概述用于解决分类、回归和聚类的计算范例; 具有构建新一代机器学习的基本技术。

这本书是关于机器学习的概念,理论和算法。在第一部分中,我们通过探索学习理论、评估方案和简单的机器学习算法,提供了关于机器学习的基本知识。在第二和第三部分中,我们将监督学习算法描述为分类和回归任务的方法,而无监督学习算法描述为聚类任务的方法。在第四部分,我们讨论了特殊类型的学习算法,并将监督算法和非监督算法的混合作为进一步的研究。读者需要线性代数和向量微积分的基本知识来理解机器学习算法,其中输入数据总是以数字向量的形式给出。

成为VIP会员查看完整内容
0
61

最新论文

Methods to learn under algorithmic triage have predominantly focused on supervised learning settings where each decision, or prediction, is independent of each other. Under algorithmic triage, a supervised learning model predicts a fraction of the instances and humans predict the remaining ones. In this work, we take a first step towards developing reinforcement learning models that are optimized to operate under algorithmic triage. To this end, we look at the problem through the framework of options and develop a two-stage actor-critic method to learn reinforcement learning models under triage. The first stage performs offline, off-policy training using human data gathered in an environment where the human has operated on their own. The second stage performs on-policy training to account for the impact that switching may have on the human policy, which may be difficult to anticipate from the above human data. Extensive simulation experiments in a synthetic car driving task show that the machine models and the triage policies trained using our two-stage method effectively complement human policies and outperform those provided by several competitive baselines.

0
0
下载
预览
子主题
Top