博客 | 总结+paper分享 | 任务型对话中的跨领域&个性化&迁移学习

2018 年 12 月 6 日 AI研习社

本文原载于微信公众号：AI部落联盟（AI_Tribe），AI研习社经授权转载。欢迎关注 AI部落联盟微信公众号、知乎专栏 AI部落、及 AI研习社博客专栏。

社长提醒：本文的相关链接请点击文末【阅读原文】进行查看

1.迁移学习

什么是迁移学习? 人们利用之前的经验和知识进行推理和学习的能力。一个系统将别的相关领域中的知识应用到本领域中的学习模式。

1.1为何需要迁移学习？

1.1.1 目标领域的训练数据太少，导致效果不佳甚至过拟合；

1.1.2 很多情况下，很多已有模型只需要fine-tuning就可以用，从头训练费时费力，甚至还不讨好；

1.1.3迁移学习可以可以做多任务多目标的学习；

另外从模型角度说下迁移学习的好处：

Lisa Torrey和Jude Shavlik在迁移学习的章节中描述了使用迁移学习的三个好处：

1.更高的起点。源模型的初始技能比其它模型要高。

2.更高的提升效率。训练源模型过程中提升技能的效率比其它模型要高。

3.较高的渐近线。训练好的模型的融合技能比其它模型要好。

1.2 迁移学习的分类

1.2.1 按特征空间分：同构迁移学习、异构迁移学习

1.2.2 按transfer方法分：Model-based、Feature-based、Instance-based、Relation-based。

1.2.3 按场景分：归纳迁移、直推迁移、无监督迁移。

1.3 迁移学习跟机器学习的比较

1.3.1 机器学习需要train data 和test data有相同数据分布，如果数据分布不同，最终结果可能是灾难式的，可能一点不亚于特征选择的重要性（决定任务的上限，而模型选择只是无限逼近于这个上限）；而迁移学习不需要train data 和test data有相同数据分布，相反可能很多时候数据分布是不同的。

1.3.2 遇到新任务时，机器学习需要重新建模和训练；迁移学习可以复用之前的建模和训练。

1.3.3 机器学习需要有足够数据；迁移学习不一定需要有足够数据。

2.任务型对话中为啥需要迁移学习

2.1 目前任务型对话的标准数据集个数比较少，而且每个数据集的数据量非常非常小，而任务型对话中涉及到的领域远远大于目前数据集包含的领域个数，这就导致了很多目标领域数据非常有限；

2.2 任务型对话中的数据标注非常的费时费力，一个可能的思路是复用已经标注好数据的其他领域训练的模型；

2.3 任务型对话中很多模型都是用了神经网络，训练时间较长，如果每次都从头训练的话，得不偿失；

3.迁移学习在任务型对话中的应用

迁移学习在任务型对话中的可能应用包括：跨领域（系统角度的迁移）、个性化（用户角度的迁移）、跨语言（数据角度的迁移）等。目前跨领域和个性化角度都有一些不错的工作，而跨语言方面的工作我看到的相对较少，如果有人了解，欢迎告知。

下面分别介绍一下迁移学习在任务型对话系统的不同模块的应用方式：

3.1 迁移学习在SLU中的用法：

3.1.1 Instance based transfer for SLU

用源域和目标域分布之间的KL散度对目标域模型进行规则化。

Multitask learning for spoken language understanding.

3.1.2 Model adaptation for SLU

在域之间自动映射相似的classes，并在域之间传递类似的instances。

Model adaptation for spoken language understanding

3.1.3 Parameter transfer

使用词嵌入向量和相似标签分类器之间的参数共享，相似的分类器具有相似的超平面。

A Model of Zero-Shot Learning of Spoken Language Understanding

3.2 迁移学习在DST中的用法：

3.2.1 Feature based transfer for DST

Multi-domain learning and generalization in dialog state tracking

Markovian discriminative modeling for cross-domain dialog state tracking

3.2.2 Model based transfer for DST

Multi- domain dialog state tracking using recurrent neural networks

3.3 迁移学习在DPL中的用法：

3.3.1 Linear Model transfer for Q-learning

Transfer learning for user adaptation in spoken dialogue systems.

3.3.2 Gaussian Process transfer for Q-learning

Incremental on-line adaptation of POMDP-based dialogue managers to extended domains

POMDP-based dialogue manager adaptation to extended domains

Distributed dialogue policies for multi domain statistical dialogue management

3.3.3 Bayesian Committee Machine transfer for Q-learning

Policy committee for adaptation in multi-domain spoken dialogue systems

3.4 迁移学习在NLG中的用法：

3.4.1 Model fine-tuning Transfer for NLG

Recurrent neural network based languagemodel personalization by social network crowdsourcing

3.4.2 Instance Synthesis Transfer for NLG

Multi-domain neural network language generation for spoken dialogue systems

以上就是我对“任务型对话中的跨领域&个性化&迁移学习”的一个简单总结，文中贴了部分论文。

完整的论文集请关注微信公众号“AI部落联盟”并回复“TL”获取下载链接。论文集截图如下。

AI求职百题斩已经悄咪咪上线啦，点击下方小程序卡片，开始愉快答题吧！

点击 阅读原文 查看本文更多内容↙

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

最新《多任务学习》综述，39页pdf

专知会员服务

266+阅读 · 2020年7月10日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

【微软雷德蒙研究院】小样本自然语言生成，Few-shot Natural Language Generation for Task-Oriented Dialog

专知会员服务

33+阅读 · 2020年2月29日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【干货】监督学习知识手册大全|维基百科书，附103页pdf下载

专知会员服务

69+阅读 · 2019年12月5日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

70+阅读 · 2019年11月25日

零样本图像分类综述 : 十年进展

专知会员服务

128+阅读 · 2019年11月16日

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

【RecSys 2019报告】基于对话的推荐（Context Adaptation with Session‐based Recommenders）

专知会员服务

33+阅读 · 2019年9月20日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

博客 | 代码+论文+解析 | 7种常见的迁移学习

AI研习社

8+阅读 · 2019年4月25日

博客 | 一文看懂任务型对话中的对话策略学习（DPL）

AI研习社

10+阅读 · 2019年4月22日

博客 | 总结 | 对话系统中的口语理解技术(SLU)（三）

AI研习社

5+阅读 · 2018年12月11日

博客 | 总结 | 对话系统中的口语理解(SLU)（一）

AI研习社

6+阅读 · 2018年12月9日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

【迁移学习】迁移学习的干货学习资料 | 干货分享 | 技术解读

产业智能官

15+阅读 · 2018年1月2日

论文 | 2017CIKM - 迁移学习专题论文分享

蚂蚁程序猿

5+阅读 · 2017年12月21日

干货｜深度强化学习在面向任务的对话管理中的应用

全球人工智能

13+阅读 · 2017年9月14日

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

Arxiv

4+阅读 · 2020年2月13日

Incorporating Relation Knowledge into Commonsense Reading Comprehension with Multi-task Learning

Arxiv

5+阅读 · 2019年9月5日

Text Summarization with Pretrained Encoders

Arxiv

5+阅读 · 2019年8月22日

One-Shot Unsupervised Cross Domain Translation

Arxiv

5+阅读 · 2018年10月23日

NeuRec: On Nonlinear Transformation for Personalized Ranking

Arxiv

5+阅读 · 2018年6月3日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

Dialog-based Interactive Image Retrieval

Arxiv

5+阅读 · 2018年5月1日

Learning to Rank Question-Answer Pairs using Hierarchical Recurrent Encoder with Latent Topic Clustering

Arxiv

5+阅读 · 2018年4月9日

Joint Training for Neural Machine Translation Models with Monolingual Data

Arxiv

4+阅读 · 2018年3月1日

VIP会员

博客 | 总结+paper分享 | 任务型对话中的跨领域&个性化&迁移学习

相关内容

知识荟萃

更多