【CIKM2022教程】信息抽取:任务、数据和开源工具的实践教程,125页ppt

2022 年 11 月 25 日 专知

信息提取(IE)是自然语言处理中一个常见的子领域,主要关注从非结构化数据中识别结构化数据。信息检索(IR)社区依赖于精确和高性能的IE,能够从海量数据集中检索高质量的结果。IE的一个例子是识别文本中的命名实体,例如,“‘Katy Perry住在美国’”。这里,Katy Perry和USA分别是PERSON和LOCATION类型的命名实体。另一个例子是识别文本中表达的情感,例如,“这部电影太棒了”。在这里,表达的情绪是积极的。最后,识别文本的不同语言方面,例如词性标签、名词短语、依赖分析等,这些可以作为附加IE任务的特征。本教程向参与者介绍a)基于Python的开源工具的使用,这些工具支持来自社交媒体数据(主要是Twitter)的IE,以及b)确保研究可重复性的最佳实践。参与者将学习和实践各种语义和语法IE技术,这些技术通常用于分析推文。此外,学员将熟悉公开的社交媒体数据(包括流行的NLP和IE基准)以及收集和准备这些数据进行分析的方法。最后,参与者将被训练使用一套开源工具(帆为主动学习,TwitterNER命名实体识别,TweetNLP基于变压器NLP,和SocialMediaIE多任务学习),它利用先进的机器学习技术(如深度学习,主动学习与human-in-the-loop、多语种、多任务学习)来执行自己IE或现有的数据集。参与者还将学习如何将社会背景整合到信息提取系统中以使其更好,以及时间在社交媒体IE质量中的作用。本教程中介绍的工具将重点介绍IE的三个主要阶段,即数据收集(包括注释)、数据处理和分析以及提取信息的可视化。更多详情请访问:https://socialmediaie.github.io/tutorials/。


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“E125” 就可以获取【CIKM2022教程】信息抽取:任务、数据和开源工具的实践教程,125页ppt》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
0

相关内容

【NeurIPS'22教程】图神经网络TensorFlow实战指南,128页ppt
专知会员服务
29+阅读 · 2022年11月30日
【KDD2022教程】多模态自动机器学习教程,130页ppt
专知会员服务
75+阅读 · 2022年8月19日
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
【COMPTEXT2022教程】跨语言监督文本分类,41页ppt
专知会员服务
16+阅读 · 2022年6月14日
专知会员服务
65+阅读 · 2021年8月1日
如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
64+阅读 · 2021年2月12日
【ICML2022教程】因果公平性分析,68页ppt
专知
2+阅读 · 2022年7月19日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2023年2月2日
Arxiv
0+阅读 · 2023年2月1日
Trace Diagnostics for Signal-based Temporal Properties
Arxiv
35+阅读 · 2022年3月14日
已删除
Arxiv
31+阅读 · 2020年3月23日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
23+阅读 · 2017年3月9日
VIP会员
相关VIP内容
【NeurIPS'22教程】图神经网络TensorFlow实战指南,128页ppt
专知会员服务
29+阅读 · 2022年11月30日
【KDD2022教程】多模态自动机器学习教程,130页ppt
专知会员服务
75+阅读 · 2022年8月19日
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
【COMPTEXT2022教程】跨语言监督文本分类,41页ppt
专知会员服务
16+阅读 · 2022年6月14日
专知会员服务
65+阅读 · 2021年8月1日
如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
64+阅读 · 2021年2月12日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
相关论文
Arxiv
0+阅读 · 2023年2月2日
Arxiv
0+阅读 · 2023年2月1日
Trace Diagnostics for Signal-based Temporal Properties
Arxiv
35+阅读 · 2022年3月14日
已删除
Arxiv
31+阅读 · 2020年3月23日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
23+阅读 · 2017年3月9日
Top
微信扫码咨询专知VIP会员