Keras新增TextVectorization层，可直接将文本字符串作为模型输入 - 专知

会员服务 ·

0

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

2019 年 11 月 22 日 专知

【导读】Keras作者François Chollet在Twitter上展示了Keras的一个新特性—TextVectorization层。借助该特性，我们可以构建包含文本预处理功能且可直接以字符串作为输入的Keras模型。

在构建NLP深度模型时，我们一般会使用额外的代码对文本进行预处理，将其处理为能够作为深度网络输入的数值型Tensor。虽然对于科研人员来说这并不是什么太大的问题，但对于工程人员来说这是一个较为棘手的问题。在实际工程中，很多情况下我们需要用TensorFlow和Keras等框架生成可被C++ SDK或TensorFlow Serving等调用的模型。并不是整个深度学习流程都可以被保存到这个模型中，尤其是一些用Python写的文本、图像等预处理操作。往往，只有那些与Tensor计算相关的常量、操作等才能被保存到模型中，工程师需要用使用模型的语言（C++、Swift等）重新实现数据预处理等操作。

NLP任务中，将文本预处理问数值Tensor是非常繁琐的过程，你需要额外保存词表、编写转换代码等。工程师需要花费大量的时间精力来理解算法工程师的文本预处理逻辑，才能够准确复现他们的文本预处理流程。

Keras新增的TextVectorization层可以完成文本预处理的逻辑（标准化、词语切分和单词索引），更重要的是，它是可以被序列化和部署的，也就是说，算法工程师可以直接在模型中封装文本预处理的逻辑，而不需要工程师额外的实现。

Keras作者François Chollet在Twitter上展示了该特性：

下面是示例代码链接：

https://colab.research.google.com/drive/1RvCnR7h0_l4Ekn5vINWToI9TNJdpUZB3

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），获取专知VIP会员码，加入专知人工智能主题群，咨询技术商务合作~

点击“阅读原文”，了解注册成为专知会员，查看5000+AI主题知识资料

登录查看更多

19

相关内容

keras

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

220+阅读 · 2020年6月14日

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

专知会员服务

21+阅读 · 2020年6月4日

【新书】学习TensorFlow2.0，177页pdf，使用Python实现机器学习和深度学习模型

【新书】学习TensorFlow2.0，177页pdf，使用Python实现机器学习和深度学习模型

专知会员服务

224+阅读 · 2019年12月28日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

163+阅读 · 2019年10月12日

《深度学习之TensorFlow工程化项目实战》配套代码及数据集电子书资源

《深度学习之TensorFlow工程化项目实战》配套代码及数据集电子书资源

专知

41+阅读 · 2019年12月15日

【资源】NLP多标签文本分类代码实现工具包

【资源】NLP多标签文本分类代码实现工具包

专知

40+阅读 · 2019年11月20日

深度学习TensorFlow实现集合

深度学习TensorFlow实现集合

专知

10+阅读 · 2018年9月8日

181页机器学习Python介绍书籍pdf下载

181页机器学习Python介绍书籍pdf下载

专知

18+阅读 · 2018年8月11日

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

专知

20+阅读 · 2018年4月22日

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Arxiv

6+阅读 · 2019年7月17日

Learned in Translation: Contextualized Word Vectors

Arxiv

6+阅读 · 2018年6月20日

Single-Perspective Warps in Natural Image Stitching

Arxiv

4+阅读 · 2018年2月13日

Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing

Arxiv

5+阅读 · 2018年1月29日

SentiBubbles: Topic Modeling and Sentiment Visualization of Entity-centric Tweets

Arxiv

3+阅读 · 2018年1月23日

VIP会员

相关主题

TensorFlow Serving

相关VIP内容

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

220+阅读 · 2020年6月14日

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

专知会员服务

21+阅读 · 2020年6月4日

【新书】学习TensorFlow2.0，177页pdf，使用Python实现机器学习和深度学习模型

【新书】学习TensorFlow2.0，177页pdf，使用Python实现机器学习和深度学习模型

专知会员服务

224+阅读 · 2019年12月28日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

163+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

因果强化学习的统一框架：综述、分类体系、算法与应用

《无人机系统 - 反无人机系统：测试方法》364页

【MIT博士论文】语言模型的推理时学习算法

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

相关资讯

《深度学习之TensorFlow工程化项目实战》配套代码及数据集电子书资源

《深度学习之TensorFlow工程化项目实战》配套代码及数据集电子书资源

专知

41+阅读 · 2019年12月15日

【资源】NLP多标签文本分类代码实现工具包

【资源】NLP多标签文本分类代码实现工具包

专知

40+阅读 · 2019年11月20日

深度学习TensorFlow实现集合

深度学习TensorFlow实现集合

专知

10+阅读 · 2018年9月8日

181页机器学习Python介绍书籍pdf下载

181页机器学习Python介绍书籍pdf下载

专知

18+阅读 · 2018年8月11日

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

专知

20+阅读 · 2018年4月22日

相关论文

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Arxiv

6+阅读 · 2019年7月17日

Learned in Translation: Contextualized Word Vectors

Arxiv

6+阅读 · 2018年6月20日

Single-Perspective Warps in Natural Image Stitching

Arxiv

4+阅读 · 2018年2月13日

Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing

Arxiv

5+阅读 · 2018年1月29日

SentiBubbles: Topic Modeling and Sentiment Visualization of Entity-centric Tweets

Arxiv

3+阅读 · 2018年1月23日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

太合音乐上市

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员