by sgrvinod
这是我计划编写的系列教程的第4部分,这一系列教程将介绍如何使用神奇的PyTorch库实现自己实现一个很酷的模型。
使用本项目的前提是假设你已经掌握了PyTorch的基本知识,递归神经网络。如果你是PyTorch的新手,建议首先阅读 PyTorch的深度学习:60分钟闪电战 和 根据实例学习PyTorch 。
如果对项目有什么问题、建议或更正都可以发布issue。
注:项目是在Python 3.6中使用 PyTorch 0.4运行的。
构建可以将文本文档标记为多个类别之一的模型。
我们将实现层次注意网络(HAN),这是一种更有趣、更易于解释的文本分类模型。
这个模型不仅对文档进行分类,还选择文本中它认为最重要的特定部分——句子和单个单词。
以下是举例及分析结果:
"I think I'm falling sick. There was some indigestion at first. But now a fever is beginning to take hold."
"But think about it! It's so cool. Physics is really all about math. What Feynman said, hehe."
"I want to tell you something important. Get into the stock market and investment funds. Make some money so you can buy yourself some yogurt."
"How do computers work? I have a CPU I want to use. But my keyboard and motherboard do not help."
"You can just google how computers work. Honestly, its easy."
"You know what's wrong with this country? Republicans and democrats. Always at each other's throats"
"There's no respect, no bipartisanship."
在此期间,你依然可以看看代码,了解它的工作原理!
我们在Yahoo Answer数据集上的准确率达到了75.1%(论文中为75.8%)。
https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Text-Classification
点击 阅读原文 ,进技术交流小组查看更多Github项目推荐