Facebook研究了深度学习推理对其数据中心的需求,以便在未来更好地进行基础设施设计:嵌入需要高显存带宽;支持强大的矩阵、向量引擎;小batch推理需要大容量片上存储;支持半精度浮点计算。
地址: https://arxiv.org/abs/1811.09886
可以生成钢琴音乐和室内乐的Clara模型采用AWD-LSTM架构,基于midi格式的古典乐样本训练。作者Christine Payne认为这一工作的成功很大程度上归功于他将midi文件编码为文本格式的做法。
地址: http://www.christinemcleavey.com/files/clara-musical-lstm.pdf
One-Shot Learning of Object Categories
李飞飞等的这项工作表明基于单个或少量样本学习某一类别的大量信息是可行的。其关键思想是利用之前学习到的关于其他类别的知识,不论这些类别的差异有多大。这篇论文开启了单样本学习这一全新的子领域,虽然目前单样本学习的主流是基于深度学习系统,而不是这篇开山之作中使用的贝叶斯实现,但这篇经典论文仍然值得重温。
地址:https://authors.library.caltech.edu/5407/1/LIFieeetpam06.pdf