rnn/lstm能达到的效果,是否都可以cnn模型达到?
关注者
25被浏览
5,935登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
transformer需要很多数据去喂吧,我自己的实验里面(多标签文本分类,数据量1.8w左右,avg doc len 500+),transformer表现比较拉跨,CNN不错,BiLSTM目前比CNN差几个点(可能没有调好),self_attention + BiLSTM目前全场最高。
transformer需要很多数据去喂吧,我自己的实验里面(多标签文本分类,数据量1.8w左右,avg doc len 500+),transformer表现比较拉跨,CNN不错,BiLSTM目前比CNN差几个点(可能没有调好),self_attention + BiLSTM目前全场最高。