主题: A novel solution for a data augmentation and bias problem in NLP using TensorFlow

报告简介: TensorFlow生态系统包含许多有价值的资产。其中之一是备受赞誉的TensorFlow高级API。在深度学习模型开发和假设检验中,快速、轻量级的方法对于缩短提前期至关重要。现在可以快速而容易地开发一种新的深度学习解决方案,以满足实际中的一个重要需求:NLP中的数据偏差和增强。解决这个问题将对模型偏差、攻击性语言检测、语言个性化和分类产生深远的影响。东航详细介绍了他的工作,以满足企业客户(世界上最大的航空公司之一)对模型的需求,该模型能够准确地审查、分类和存储飞机维修日志中的文本,以符合联邦航空局关于航空安全的规定。客户的数据是不平衡的,并且偏向于某些类别。数据不平衡的机器学习模型不可避免地会产生模型偏差,文本生成是数据增强的一种新的重要方法。在NLP中,许多现有的增强少数数据的方法都是无监督的,仅限于同义词交换、插入、删除或过采样。这些广义的方法常常导致精确性和召回之间的权衡。它们在实践中也不能很好地工作,因为企业数据几乎总是特定于领域的。需要有一个更好的框架,通过学习任何领域特定的文本来生成新的语料库。KC提出了一种新的基于TensorFlow的深度学习框架来快速实现这一目标。在平衡数据集上训练基准模型。从这个数据集中,一个类被低估为代表不足的少数类文本。然后,门控递归单元(GRU)模型学习生成更多的不充分文本,这有助于训练对文本进行分类的长期短期记忆(LSTM)模型。对保持数据的分析结果表明,用生成的文本训练的模型是非常有效的。每一类的分类准确度、准确度和召回率都与基准模型相当,而不影响准确度或召回率。简言之,这证明了企业客户在快速利用和应用TensorFlow高级API构建新的产品级部署解决方案、展示新的数据增强框架的有效性、识别“杀手级应用程序”或新的文本核心价值方面采用TensorFlow的成功机器学习模型偏差和业务影响的产生、最佳实践和指导。KC还详细介绍了如何包含TensorFlow应用程序,并在云中的Kubernetes集群中为其提供服务,所有这些都使用开源Python库。TensorFlow高级API被证明是快速、高质量的深度学习模型开发体验所不可或缺的。最重要的是,这个TySoFr流模型可以部署在云、机房或边缘的容器中,为满足各种解决方案架构或业务需求提供很大的灵活性。

嘉宾介绍: 董建华是微软的人工智能设计师。此前,他曾是云架构师、ML工程师和数据科学家,在许多企业用例驱动架构中,使用开源机器学习库(如TensorFlow、Keras、,Pythorch和H2O。他的专长是端到端模型和数据结构设计中的AI和ML,在云中或本地进行测试和服务,以及以云为中心实现中的AI和ML的技术核心、实验设计、假设开发和参考体系结构。KC拥有德克萨斯大学西南医学中心分子生物物理学博士学位。

成为VIP会员查看完整内容
4

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【Strata Data Conference】用于自然语言处理的深度学习方法
专知会员服务
48+阅读 · 2019年9月23日
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
各种NLP操作难实现?谷歌开源序列建模框架Lingvo
机器之心
4+阅读 · 2019年2月26日
可应用于实际的14个NLP突破性研究成果(一)
云栖社区
7+阅读 · 2019年2月18日
TF Boys必看!一文搞懂TensorFlow 2.0新架构!
引力空间站
18+阅读 · 2019年1月16日
手把手教你搞定90%的NLP问题
AI前线
3+阅读 · 2018年3月18日
如何解决自然语言处理中 90% 的问题
AI研习社
4+阅读 · 2018年2月15日
教程帖:如何解决90%的NLP问题(上)
论智
3+阅读 · 2018年2月12日
Arxiv
6+阅读 · 2020年4月14日
A Probe into Understanding GAN and VAE models
Arxiv
9+阅读 · 2018年12月13日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
【Strata Data Conference】用于自然语言处理的深度学习方法
专知会员服务
48+阅读 · 2019年9月23日
相关资讯
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
各种NLP操作难实现?谷歌开源序列建模框架Lingvo
机器之心
4+阅读 · 2019年2月26日
可应用于实际的14个NLP突破性研究成果(一)
云栖社区
7+阅读 · 2019年2月18日
TF Boys必看!一文搞懂TensorFlow 2.0新架构!
引力空间站
18+阅读 · 2019年1月16日
手把手教你搞定90%的NLP问题
AI前线
3+阅读 · 2018年3月18日
如何解决自然语言处理中 90% 的问题
AI研习社
4+阅读 · 2018年2月15日
教程帖:如何解决90%的NLP问题(上)
论智
3+阅读 · 2018年2月12日
微信扫码咨询专知VIP会员