新智元报道
来源:专知(Quan_Zhuanzhi)
作者:{joelg,mattg,markn}@allenai.org
现代的NLP研究工作都需要编写代码。良好的代码可以实现快速的原型设计,简单的代码调试,实验的可控性和可视化,帮助研究人员快速准确地了解实验和模型的具体情况。而糟糕的代码往往导致拖慢研究进度,研究难以扩展,研究结果难以复现,最严重的是出现错误的研究和结论。实际上,现在研究人员也逐渐认识到好的研究工具,包括高质量的实验代码,对研究的重要性,那么如何为NLP任务写出良好的代码呢? EMNLP2018 254 页的《为NLP研究写出好代码》(Writing Code for NLP Research)的教程会给出答案。
该教程,借鉴了最近发布的基于PyTorch的深度学习NLP研究库AllenNLP的代码,旨在分享编写NLP研究代码的良好实践经验。教程中将使用AllenNLP中实现的NLP模型作为示例,解释具有正确抽象化和组件化的库如何实现更好的代码和研究。通过该教程,你将学习如何编写NLP研究实验代码,如何设计和简单化实验代码,从而推进研究,产出好的研究成果。
教程目录:
1. 在原型设计时如何编写代码(How to write code when prototyping)
2. 构建良好的代码流程(Developing good processes)
3. 如何为NLP研究编写可复用的代码(How to write reusable codefor NLP)
4. 案例分析:词性标注器(Case Study:A Part-of-SpeechTagger)
5. 分享你的研究(Share your research)
文末附下载地址。
254页PPT下载地址:
https://docs.google.com/presentation/d/17NoJY2SnC2UMbVegaRCWA7Oca7UCZ3vHnMqBV4SUayc/preview?slide=id.g4482b4d82e_0_110
(本文经授权转载自专知:Quan_Zhuanzhi,点击阅读原文查看原文。)
【加入社群】
新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号:aiera2015_3 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。