近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。预训练语言模型本身就是神经网络语言模型,它的特点包括:第一,可以使用大规模无标注纯文本语料进行训练;第二,可以用于各类下游NLP任务,不是针对某项定制的,但以后可用在下游NIP任务上,你不需要为下游任务专门设计一种神经网络,或者提供一种结构,直接在几种给定的固定框架中选择一种进行 fine-tune,就可以从而得到很好的结果。
Arxiv
0+阅读 · 2023年5月2日
Arxiv
1+阅读 · 2023年4月18日
Arxiv
0+阅读 · 2023年4月13日
Arxiv
0+阅读 · 2023年4月12日
Arxiv
0+阅读 · 2023年4月12日
A Survey of Large Language Models
Arxiv
7+阅读 · 2023年4月12日
微信扫码咨询专知VIP会员