这个数据集包括1393篇英语新闻文章和909篇德语新闻文章。英语语料库是免费的,德国语料库需要收钱(75美元)。英语语料实际上是RCV1(Reuters Corpus, Volume 1)。实体被标注为四种类型: LOC (location, 地名) ORG (organisation, 组织机构名) PER (person, 人名) MISC (miscellaneous, 其他)
命名实体识别从数据集到算法实现
专知
55+阅读 · 2018年6月28日
基于PyTorch/TorchText的自然语言处理库
专知
27+阅读 · 2019年4月22日
COLING 2018 最佳论文解读:序列标注经典模型复现
参考链接
微信扫码咨询专知VIP会员