Github项目推荐 | NeuronBlocks：微软发布的模块化深度学习NLP工具集 - 专知

会员服务 ·

0

Github项目推荐 | NeuronBlocks：微软发布的模块化深度学习NLP工具集

2019 年 4 月 26 日 AI科技评论

概览

NeuronBlocks是一个NLP深度学习建模工具包，可帮助工程师构建用于NLP任务的神经网络模型训练的端到端管道。该工具包的主要目标是将NLP深度神经网络模型构建的开发成本降到最低，包括训练阶段和推理阶段。有关详细信息，请查看我们的论文：NeuronBlocks -- Building Your NLP DNN Models Like Playing Lego

Github项目地址：

https://github.com/Microsoft/NeuronBlock

NeuronBlocks由两个主要组件组成：Block Zoo和Model Zoo。

在Block Zoo中，我们提供常用的神经网络组件作为模型架构设计的构建块。

在Model Zoo中，我们以JSON配置文件的形式为常见的NLP任务提供了一套NLP模型。

工具包用法

用户可以选择Model Zoo中的现有模型（配置文件）来开始模型训练，或者通过利用Block Zoo中的神经网络块创建新模型，就像玩乐高积木一样。

支持NLP任务

句子分类
问答匹配
文本含义
插槽标记
机器阅读理解
更多任务正在开发中

NeuronBlocks的推荐使用人群

使用神经网络模型解决NLP问题时面临以下挑战的工程师或研究人员：

框架选择多，研究成本高。
编码成本高。大量的细节使得调试非常困难。
快速模型架构演变。工程师很难理解他们背后的数学原理。
模型代码优化需要深厚的专业知识。
模型平台兼容性要求。它需要额外的编码工作才能使模型在不同的平台上运行，例如Linux / Windows，GPU / CPU。

利用NeuronBlocks进行NLP神经网络模型训练的优势包括：

模型构建：对于模型构建和参数调整，用户只需编写简单的JSON配置文件，这大大减少了实现新思想的工作量。
模型共享：通过JSON文件可以非常容易地进行模型共享模型，而非讨厌的代码。对于不同的模型或任务，我们的用户只需要维护一个集中的源代码库。
代码可重用性：可以在各种模型或任务之间轻松共享公共代码块，从而减少重复编码工作。
平台灵活性：NeuronBlocks可以在Linux和Windows机器上运行，同时使用CPU和GPU。它还支持像Philly和PAI这样的GPU平台上的培训。
模型可视化：提供了一个模型可视化器，用于可视化和配置正确性检查，帮助用户在调试过程中轻松地查看可视化模型架构。
可扩展性：NeuronBlocks是可扩展的，允许用户贡献新块或贡献新模型（JSON文件）。

NeuronBlocks入门

请查看 Tutorial.md 和代码文档。

贡献

NeuronBlocks在开放模型中运行。它由微软的STCA NLP Group设计和开发。我们亦欢迎学术界及业界人士作出贡献。有关更多的详细信息，请查看Contributing.md 。

正在进行的工作

模型压缩的知识提炼。重型模型的知识提炼，如BERT，OpenAI Transformer。基于师生的知识提炼是模型压缩的常用方法。
多语言支持
NER模型支持
多任务培训支持

参考文献

论文：NeuronBlocks -- Building Your NLP DNN Models Like Playing Lego

https://arxiv.org/abs/1904.09535.

相关项目

OpenPAI是一个开源平台，可提供完整的AI模型培训和资源管理功能，可以轻松扩展和支持各种规模的内部部署、云和混合环境。

AI样本：深度学习样本和项目集合。它包含了许多经典的深度学习算法和具有不同框架的应用程序，这对于开始深度学习的初学者来说是一个很好的入门工具。

License

Copyright (c) Microsoft Corporation. All rights reserved.

Licensed under the MIT License.

Contact

如有任何问题，可联系：NeuronBlocks@microsoft.com

点击阅读原文，查看清华大学刘知远老师亲授：如何写一篇合格的NLP论文

登录查看更多

3

相关内容

NLP

NLP:自然语言处理

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

219+阅读 · 2020年6月14日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

专知会员服务

104+阅读 · 2020年2月4日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【电子书推荐】在谷歌云平台上构建机器学习和深度学习模型，703页pdf，一个全面的初学者指南

【电子书推荐】在谷歌云平台上构建机器学习和深度学习模型，703页pdf，一个全面的初学者指南

专知会员服务

41+阅读 · 2020年1月2日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【课程推荐】斯坦福课程：信息检索与网络搜索《CS 276: Information Retrieval and Web Search(Spring quarter 2019)》by Chris Manning, Pandu Nayak

【课程推荐】斯坦福课程：信息检索与网络搜索《CS 276: Information Retrieval and Web Search(Spring quarter 2019)》by Chris Manning, Pandu Nayak

专知会员服务

46+阅读 · 2019年12月2日

Microsoft Icecaps：一个用于会话建模的开源工具包

Microsoft Icecaps：一个用于会话建模的开源工具包

AI前线

3+阅读 · 2019年9月9日

微软开源项目 NeuronBlocks：像搭积木一样构建 NLP 深度学习模型！

微软开源项目 NeuronBlocks：像搭积木一样构建 NLP 深度学习模型！

CSDN

6+阅读 · 2019年5月12日

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

新智元

9+阅读 · 2019年5月11日

微软开源项目NeuronBlocks - 像搭积木一样构建NLP深度学习模型

微软开源项目NeuronBlocks - 像搭积木一样构建NLP深度学习模型

PaperWeekly

3+阅读 · 2019年5月7日

GitHub获赞过千：PyTorch 自然语言处理项目Top 5

GitHub获赞过千：PyTorch 自然语言处理项目Top 5

新智元

12+阅读 · 2018年7月10日

Github 上 Star 过千的 PyTorch NLP 相关项目

Github 上 Star 过千的 PyTorch NLP 相关项目

专知

3+阅读 · 2018年7月5日

Github项目推荐 | 用于自然语言处理的开源 Python 库 —— PyTorch-NLP

Github项目推荐 | 用于自然语言处理的开源 Python 库 —— PyTorch-NLP

AI研习社

9+阅读 · 2018年3月20日

Github 项目推荐 | 微软开源 MMdnn，模型可在多框架间转换

Github 项目推荐 | 微软开源 MMdnn，模型可在多框架间转换

AI研习社

3+阅读 · 2018年2月28日

Github 项目推荐 | 用 TensorFlow 实现的模型集合

Github 项目推荐 | 用 TensorFlow 实现的模型集合

AI研习社

5+阅读 · 2018年2月14日

推荐｜斯坦福的Stanford.NLP.NET：集合多个NLP工具

推荐｜斯坦福的Stanford.NLP.NET：集合多个NLP工具

全球人工智能

3+阅读 · 2017年12月25日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Deep Regionlets for Object Detection

Arxiv

3+阅读 · 2018年3月27日

Generative Adversarial Networks and Probabilistic Graph Models for Hyperspectral Image Classification

Arxiv

11+阅读 · 2018年2月10日

Deep Learning based Recommender System: A Survey and New Perspectives

Arxiv

6+阅读 · 2017年8月3日

VIP会员

相关主题

相关VIP内容

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

219+阅读 · 2020年6月14日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

专知会员服务

104+阅读 · 2020年2月4日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【电子书推荐】在谷歌云平台上构建机器学习和深度学习模型，703页pdf，一个全面的初学者指南

【电子书推荐】在谷歌云平台上构建机器学习和深度学习模型，703页pdf，一个全面的初学者指南

专知会员服务

41+阅读 · 2020年1月2日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【课程推荐】斯坦福课程：信息检索与网络搜索《CS 276: Information Retrieval and Web Search(Spring quarter 2019)》by Chris Manning, Pandu Nayak

【课程推荐】斯坦福课程：信息检索与网络搜索《CS 276: Information Retrieval and Web Search(Spring quarter 2019)》by Chris Manning, Pandu Nayak

专知会员服务

46+阅读 · 2019年12月2日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

Microsoft Icecaps：一个用于会话建模的开源工具包

Microsoft Icecaps：一个用于会话建模的开源工具包

AI前线

3+阅读 · 2019年9月9日

微软开源项目 NeuronBlocks：像搭积木一样构建 NLP 深度学习模型！

微软开源项目 NeuronBlocks：像搭积木一样构建 NLP 深度学习模型！

CSDN

6+阅读 · 2019年5月12日

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

新智元

9+阅读 · 2019年5月11日

微软开源项目NeuronBlocks - 像搭积木一样构建NLP深度学习模型

微软开源项目NeuronBlocks - 像搭积木一样构建NLP深度学习模型

PaperWeekly

3+阅读 · 2019年5月7日

GitHub获赞过千：PyTorch 自然语言处理项目Top 5

GitHub获赞过千：PyTorch 自然语言处理项目Top 5

新智元

12+阅读 · 2018年7月10日

Github 上 Star 过千的 PyTorch NLP 相关项目

Github 上 Star 过千的 PyTorch NLP 相关项目

专知

3+阅读 · 2018年7月5日

Github项目推荐 | 用于自然语言处理的开源 Python 库 —— PyTorch-NLP

Github项目推荐 | 用于自然语言处理的开源 Python 库 —— PyTorch-NLP

AI研习社

9+阅读 · 2018年3月20日

Github 项目推荐 | 微软开源 MMdnn，模型可在多框架间转换

Github 项目推荐 | 微软开源 MMdnn，模型可在多框架间转换

AI研习社

3+阅读 · 2018年2月28日

Github 项目推荐 | 用 TensorFlow 实现的模型集合

Github 项目推荐 | 用 TensorFlow 实现的模型集合

AI研习社

5+阅读 · 2018年2月14日

推荐｜斯坦福的Stanford.NLP.NET：集合多个NLP工具

推荐｜斯坦福的Stanford.NLP.NET：集合多个NLP工具

全球人工智能

3+阅读 · 2017年12月25日

相关论文

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Deep Regionlets for Object Detection

Arxiv

3+阅读 · 2018年3月27日

Generative Adversarial Networks and Probabilistic Graph Models for Hyperspectral Image Classification

Arxiv

11+阅读 · 2018年2月10日

Deep Learning based Recommender System: A Survey and New Perspectives

Arxiv

6+阅读 · 2017年8月3日

大家都在搜

久别重逢话双塔

大型语言模型

CMU博士论文

软件无线电

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员