中科院计算所发布MatchZoo 2.0，深度文本匹配工具 - 专知

会员服务 ·

0

中科院计算所发布MatchZoo 2.0，深度文本匹配工具

2019 年 1 月 12 日 专知

【导读】深度文本匹配在检索式问答、文本检索等领域都有较为广泛的应用，MatchZoo是一款深度文本匹配的工具。它是为了促进深度文本匹配模型的设计比较和共享而开发。这里有很多像DRMM,MatchPyramid, MV-LSTM, aNMM, DUET, ARC-I, ARC-II, DSSM和 CDSSM一样的深度匹配模型，使用统一的接口进行封装。MatchZoo主要解决的任务有文档检索，问题回答，会话应答排序，同义句识别，等等。该项目主要由中科院网络数据科学与技术重点实验室团队维护。

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知）

后台回复“MZoo” 就可以获取深度匹配论文论文下载链接~

专知《深度学习：算法到实战》2019年1月正在开讲，欢迎报名！

专知开课啦!《深度学习: 算法到实战》, 中科院博士为你讲授！

MatchZoo 结构

根据此前介绍，可以看到，MatchZoo 使用了 Keras 中的神经网络层，由数据预处理、模型构建、训练与评测三大模块组成，具体结构如下图。

数据预处理模块：该模块包含通用的文本预处理功能，如分词、词频过滤、词干还原等，并将不同类型文本匹配任务的数据处理成统一的格式。
同时该模块针对不同的任务需求提供了不同的数据生成器，包括有基于单文档的数据生成器、基于文档对的数据生成器、以及基于文档列表的数据生成器。不同的数据生成器可适用于不同的文本匹配任务，如文本问答、文本对话、以及文本排序等。
模型构建模块：该模块包含了深度学习模型中广泛使用的普通层，如卷积层、池化层、全连接层等。除此之外，在这一模块中，他们还针对文本匹配定制了特定的层，如动态池化层、张量匹配层等。
训练与评测模块：该模块提供了针对回归、分类、排序等问题的目标函数和评价指标函数。用户可以根据任务的需要选择合适的目标函数。
在模型评估时，MatchZoo 也提供了多个广为使用的评价指标函数，如 MAP、NDCG、Precision，Recall 等。

只需要几步就能训练和使用一个深度语义匹配模型~

首先引入matchzoo并准备好数据：

然后预处理数据

在定制损失函数与评价指标

最后初始化模型，调节超参数！

Github地址：

https://github.com/NTMC-Community/MatchZoo

使用文档：

https://matchzoo.readthedocs.io/en/2.0/

论文地址：

http://www.zhuanzhi.ai/paper/689a25f1e6fa3570d864365772f6b46e

-END-

专 · 知

专知《深度学习: 算法到实战》课程正在开讲！中科院博士为你讲授！

请加专知小助手微信（扫一扫如下二维码添加），咨询《深度学习:算法到实战》参团限时优惠报名~

欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

11

相关内容

中科院计算技术研究所

中科院计算技术研究所

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

面向司法案件的案情知识图谱自动构建

面向司法案件的案情知识图谱自动构建

专知会员服务

126+阅读 · 2020年4月17日

【WWW2020】DGL深度图神经网络实战教程，PPT+代码

【WWW2020】DGL深度图神经网络实战教程，PPT+代码

专知会员服务

176+阅读 · 2020年4月12日

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

专知会员服务

61+阅读 · 2020年4月7日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

163+阅读 · 2020年3月11日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知会员服务

76+阅读 · 2020年1月30日

【书籍推荐】简洁的Python编程（Clean Python），附274页pdf

【书籍推荐】简洁的Python编程（Clean Python），附274页pdf

专知会员服务

183+阅读 · 2020年1月1日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

PaperWeekly

26+阅读 · 2019年7月20日

推荐系统产品与算法概述 | 深度

推荐系统产品与算法概述 | 深度

AI100

11+阅读 · 2019年6月13日

深度文本匹配在智能客服中的应用

深度文本匹配在智能客服中的应用

AI100

18+阅读 · 2018年10月24日

如何匹配两段文本的语义？

如何匹配两段文本的语义？

黑龙江大学自然语言处理实验室

7+阅读 · 2018年7月21日

【CQA论文笔记】基于卷积深度相关性计算的社区问答方法，建模问题和回答的匹配关系

【CQA论文笔记】基于卷积深度相关性计算的社区问答方法，建模问题和回答的匹配关系

专知

3+阅读 · 2018年3月26日

中科院计算所范意兴专访：深度文本匹配工具 MatchZoo 背后的个中细节

中科院计算所范意兴专访：深度文本匹配工具 MatchZoo 背后的个中细节

AI科技评论

4+阅读 · 2017年12月23日

深度文本匹配开源工具（MatchZoo）

深度文本匹配开源工具（MatchZoo）

中国科学院网络数据重点实验室

7+阅读 · 2017年12月5日

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

开放知识图谱

9+阅读 · 2017年7月24日

YesOfCourse团队在Kaggle文本匹配竞赛中获得优异成绩

YesOfCourse团队在Kaggle文本匹配竞赛中获得优异成绩

中国科学院网络数据重点实验室

10+阅读 · 2017年6月15日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

11+阅读 · 2019年6月2日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

SPM-Tracker: Series-Parallel Matching for Real-Time Visual Object Tracking

SPM-Tracker: Series-Parallel Matching for Real-Time Visual Object Tracking

Arxiv

3+阅读 · 2019年4月9日

Dual Memory Network Model for Biased Product Review Classification

Dual Memory Network Model for Biased Product Review Classification

Arxiv

3+阅读 · 2018年9月16日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

Learning Matching Models with Weak Supervision for Response Selection in Retrieval-based Chatbots

Arxiv

4+阅读 · 2018年5月7日

Parallel Tracking and Verifying

Arxiv

8+阅读 · 2018年1月30日

ParVecMF: A Paragraph Vector-based Matrix Factorization Recommender System

Arxiv

9+阅读 · 2018年1月10日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

VIP会员

相关主题

中科院计算技术研究所

文本匹配模型

中国科学院

相关VIP内容

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

面向司法案件的案情知识图谱自动构建

面向司法案件的案情知识图谱自动构建

专知会员服务

126+阅读 · 2020年4月17日

【WWW2020】DGL深度图神经网络实战教程，PPT+代码

【WWW2020】DGL深度图神经网络实战教程，PPT+代码

专知会员服务

176+阅读 · 2020年4月12日

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

专知会员服务

61+阅读 · 2020年4月7日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

163+阅读 · 2020年3月11日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知会员服务

76+阅读 · 2020年1月30日

【书籍推荐】简洁的Python编程（Clean Python），附274页pdf

【书籍推荐】简洁的Python编程（Clean Python），附274页pdf

专知会员服务

183+阅读 · 2020年1月1日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

PaperWeekly

26+阅读 · 2019年7月20日

推荐系统产品与算法概述 | 深度

推荐系统产品与算法概述 | 深度

AI100

11+阅读 · 2019年6月13日

深度文本匹配在智能客服中的应用

深度文本匹配在智能客服中的应用

AI100

18+阅读 · 2018年10月24日

如何匹配两段文本的语义？

如何匹配两段文本的语义？

黑龙江大学自然语言处理实验室

7+阅读 · 2018年7月21日

【CQA论文笔记】基于卷积深度相关性计算的社区问答方法，建模问题和回答的匹配关系

【CQA论文笔记】基于卷积深度相关性计算的社区问答方法，建模问题和回答的匹配关系

专知

3+阅读 · 2018年3月26日

中科院计算所范意兴专访：深度文本匹配工具 MatchZoo 背后的个中细节

中科院计算所范意兴专访：深度文本匹配工具 MatchZoo 背后的个中细节

AI科技评论

4+阅读 · 2017年12月23日

深度文本匹配开源工具（MatchZoo）

深度文本匹配开源工具（MatchZoo）

中国科学院网络数据重点实验室

7+阅读 · 2017年12月5日

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

技术动态 | 基于深度学习的中文自然语言处理工具 FudanDNN-NLP3.0

开放知识图谱

9+阅读 · 2017年7月24日

YesOfCourse团队在Kaggle文本匹配竞赛中获得优异成绩

YesOfCourse团队在Kaggle文本匹配竞赛中获得优异成绩

中国科学院网络数据重点实验室

10+阅读 · 2017年6月15日

相关论文

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

11+阅读 · 2019年6月2日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

SPM-Tracker: Series-Parallel Matching for Real-Time Visual Object Tracking

SPM-Tracker: Series-Parallel Matching for Real-Time Visual Object Tracking

Arxiv

3+阅读 · 2019年4月9日

Dual Memory Network Model for Biased Product Review Classification

Dual Memory Network Model for Biased Product Review Classification

Arxiv

3+阅读 · 2018年9月16日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

Learning Matching Models with Weak Supervision for Response Selection in Retrieval-based Chatbots

Arxiv

4+阅读 · 2018年5月7日

Parallel Tracking and Verifying

Arxiv

8+阅读 · 2018年1月30日

ParVecMF: A Paragraph Vector-based Matrix Factorization Recommender System

Arxiv

9+阅读 · 2018年1月10日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

滴滴司机调度系统实践

微信扫码咨询专知VIP会员