【CIKM2022教程】信息抽取：任务、数据和开源工具的实践教程，125页ppt - 专知VIP

会员服务 ·

20

CIKM 2022 · 信息抽取 · 教程 ·

2022 年 11 月 25 日

【CIKM2022教程】信息抽取：任务、数据和开源工具的实践教程，125页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

信息提取(IE)是自然语言处理中一个常见的子领域，主要关注从非结构化数据中识别结构化数据。信息检索(IR)社区依赖于精确和高性能的IE，能够从海量数据集中检索高质量的结果。IE的一个例子是识别文本中的命名实体，例如，“‘Katy Perry住在美国’”。这里，Katy Perry和USA分别是PERSON和LOCATION类型的命名实体。另一个例子是识别文本中表达的情感，例如，“这部电影太棒了”。在这里，表达的情绪是积极的。最后，识别文本的不同语言方面，例如词性标签、名词短语、依赖分析等，这些可以作为附加IE任务的特征。本教程向参与者介绍a)基于Python的开源工具的使用，这些工具支持来自社交媒体数据(主要是Twitter)的IE，以及b)确保研究可重复性的最佳实践。参与者将学习和实践各种语义和语法IE技术，这些技术通常用于分析推文。此外，学员将熟悉公开的社交媒体数据(包括流行的NLP和IE基准)以及收集和准备这些数据进行分析的方法。最后,参与者将被训练使用一套开源工具(帆为主动学习,TwitterNER命名实体识别,TweetNLP基于变压器NLP,和SocialMediaIE多任务学习),它利用先进的机器学习技术(如深度学习,主动学习与human-in-the-loop、多语种、多任务学习)来执行自己IE或现有的数据集。参与者还将学习如何将社会背景整合到信息提取系统中以使其更好，以及时间在社交媒体IE质量中的作用。本教程中介绍的工具将重点介绍IE的三个主要阶段，即数据收集(包括注释)、数据处理和分析以及提取信息的可视化。更多详情请访问:https://socialmediaie.github.io/tutorials/。

成为VIP会员查看完整内容

35

相关内容

CIKM 2022

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知会员服务

44+阅读 · 2022年10月11日

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

专知会员服务

23+阅读 · 2022年9月4日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知会员服务

87+阅读 · 2022年8月18日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知会员服务

38+阅读 · 2022年7月14日

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

专知会员服务

20+阅读 · 2022年4月25日

反事实学习如何用于推荐！看RecSys2021教程《推荐系统反事实学习和评估:基础、实施和最新进展》，

专知会员服务

35+阅读 · 2021年9月30日

如何挖掘医疗数据？看这份KDD2021《异构医疗数据挖掘》教程，附Slides

专知会员服务

47+阅读 · 2021年8月19日

【SIGIR2021】自然语言处理图深度学习，230页ppt

【SIGIR2021】自然语言处理图深度学习，230页ppt

专知会员服务

95+阅读 · 2021年7月23日

【AAAI2021 Tutorial】工业界负责任的人工智能，262页ppt

【AAAI2021 Tutorial】工业界负责任的人工智能，262页ppt

专知会员服务

116+阅读 · 2021年2月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

71+阅读 · 2019年11月25日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

专知

0+阅读 · 2022年9月4日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知

0+阅读 · 2022年8月18日

如何构建多模态鲁棒信息提取系统？NAACL2022《信息提取前沿》教程，261页ppt

如何构建多模态鲁棒信息提取系统？NAACL2022《信息提取前沿》教程，261页ppt

专知

2+阅读 · 2022年7月11日

【NAACL2022】自然语言处理的对比数据与学习，157页ppt与视频

【NAACL2022】自然语言处理的对比数据与学习，157页ppt与视频

专知

2+阅读 · 2022年7月10日

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

专知

2+阅读 · 2022年4月25日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

25+阅读 · 2020年12月30日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

推荐系统资源(文献、工具、框架)整理

推荐系统资源(文献、工具、框架)整理

专知

18+阅读 · 2019年2月4日

自然语言处理工具包spaCy介绍

自然语言处理工具包spaCy介绍

AINLP

18+阅读 · 2016年11月14日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

MOOC数据模型及其对课程与学习评价的效用研究

国家自然科学基金

4+阅读 · 2014年12月31日

COMET实验CDC软件发展和数据处理

国家自然科学基金

0+阅读 · 2014年12月31日

基于多语用户模型的个性化跨语言信息检索研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向个性化推荐的地理信息可视化方法

国家自然科学基金

4+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

情感信息抽取的资源建设及关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向数据密集型计算的概率图模型构建与推理

国家自然科学基金

1+阅读 · 2011年12月31日

基于多模态概率主题模型的实体相关文本可视化

国家自然科学基金

1+阅读 · 2011年12月31日

问答式信息检索中信息抽取技术研究

国家自然科学基金

3+阅读 · 2008年12月31日

ALBETO and DistilBETO: Lightweight Spanish Language Models

Arxiv

0+阅读 · 2023年1月25日

HierarchicalForecast: A Reference Framework for Hierarchical Forecasting in Python

Arxiv

0+阅读 · 2023年1月25日

A Case Study in Engineering a Conversational Programming Assistant's Persona

Arxiv

0+阅读 · 2023年1月13日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

24+阅读 · 2021年8月12日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Towards Understanding and Answering Multi-Sentence Recommendation Questions on Tourism

Arxiv

15+阅读 · 2018年1月5日

Multimodal Machine Learning: A Survey and Taxonomy

Arxiv

151+阅读 · 2017年8月1日

VIP会员

相关主题

相关VIP内容

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知会员服务

44+阅读 · 2022年10月11日

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

专知会员服务

23+阅读 · 2022年9月4日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知会员服务

87+阅读 · 2022年8月18日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知会员服务

38+阅读 · 2022年7月14日

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

专知会员服务

20+阅读 · 2022年4月25日

反事实学习如何用于推荐！看RecSys2021教程《推荐系统反事实学习和评估:基础、实施和最新进展》，

专知会员服务

35+阅读 · 2021年9月30日

如何挖掘医疗数据？看这份KDD2021《异构医疗数据挖掘》教程，附Slides

专知会员服务

47+阅读 · 2021年8月19日

【SIGIR2021】自然语言处理图深度学习，230页ppt

【SIGIR2021】自然语言处理图深度学习，230页ppt

专知会员服务

95+阅读 · 2021年7月23日

【AAAI2021 Tutorial】工业界负责任的人工智能，262页ppt

【AAAI2021 Tutorial】工业界负责任的人工智能，262页ppt

专知会员服务

116+阅读 · 2021年2月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

71+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体化人工智能：架构、应用及未来发展方向的综合综述

《自主武器》365页书籍

联邦学习综述：多层次聚合技术的系统分类、实验洞察与未来前沿

人工智能在空战中的局限及其真正适用领域

相关资讯

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

【KDD2022-教程】深度搜索相关性排名的实践，74页ppt

专知

0+阅读 · 2022年9月4日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知

0+阅读 · 2022年8月18日

如何构建多模态鲁棒信息提取系统？NAACL2022《信息提取前沿》教程，261页ppt

如何构建多模态鲁棒信息提取系统？NAACL2022《信息提取前沿》教程，261页ppt

专知

2+阅读 · 2022年7月11日

【NAACL2022】自然语言处理的对比数据与学习，157页ppt与视频

【NAACL2022】自然语言处理的对比数据与学习，157页ppt与视频

专知

2+阅读 · 2022年7月10日

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

如何挖掘科学知识？UIUC最新WWW22教程-科学文献数据挖掘：现代自然语言处理技术:任务、数据和工具

专知

2+阅读 · 2022年4月25日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

25+阅读 · 2020年12月30日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

推荐系统资源(文献、工具、框架)整理

推荐系统资源(文献、工具、框架)整理

专知

18+阅读 · 2019年2月4日

自然语言处理工具包spaCy介绍

自然语言处理工具包spaCy介绍

AINLP

18+阅读 · 2016年11月14日

相关基金

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

MOOC数据模型及其对课程与学习评价的效用研究

国家自然科学基金

4+阅读 · 2014年12月31日

COMET实验CDC软件发展和数据处理

国家自然科学基金

0+阅读 · 2014年12月31日

基于多语用户模型的个性化跨语言信息检索研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向个性化推荐的地理信息可视化方法

国家自然科学基金

4+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

情感信息抽取的资源建设及关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向数据密集型计算的概率图模型构建与推理

国家自然科学基金

1+阅读 · 2011年12月31日

基于多模态概率主题模型的实体相关文本可视化

国家自然科学基金

1+阅读 · 2011年12月31日

问答式信息检索中信息抽取技术研究

国家自然科学基金

3+阅读 · 2008年12月31日

相关论文

ALBETO and DistilBETO: Lightweight Spanish Language Models

Arxiv

0+阅读 · 2023年1月25日

HierarchicalForecast: A Reference Framework for Hierarchical Forecasting in Python

Arxiv

0+阅读 · 2023年1月25日

A Case Study in Engineering a Conversational Programming Assistant's Persona

Arxiv

0+阅读 · 2023年1月13日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

24+阅读 · 2021年8月12日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Towards Understanding and Answering Multi-Sentence Recommendation Questions on Tourism

Arxiv

15+阅读 · 2018年1月5日

Multimodal Machine Learning: A Survey and Taxonomy

Arxiv

151+阅读 · 2017年8月1日

微信扫码咨询专知VIP会员