近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。预训练语言模型本身就是神经网络语言模型,它的特点包括:第一,可以使用大规模无标注纯文本语料进行训练;第二,可以用于各类下游NLP任务,不是针对某项定制的,但以后可用在下游NIP任务上,你不需要为下游任务专门设计一种神经网络,或者提供一种结构,直接在几种给定的固定框架中选择一种进行 fine-tune,就可以从而得到很好的结果。
融合知识图谱的预训练模型研究综述
专知会员服务
38+阅读 · 3月31日
【博士论文】神经语言模型的参数效率,199页pdf
专知会员服务
28+阅读 · 3月13日
预训练语言模型的应用综述
专知会员服务
35+阅读 · 2023年1月23日
微信扫码咨询专知VIP会员