Modern machine learning algorithms are capable of providing remarkably accurate point-predictions; however, questions remain about their statistical reliability. Unlike conventional machine learning methods, conformal prediction algorithms return confidence sets (i.e., set-valued predictions) that correspond to a given significance level. Moreover, these confidence sets are valid in the sense that they guarantee finite sample control over type 1 error probabilities, allowing the practitioner to choose an acceptable error rate. In our paper, we propose inductive conformal prediction (ICP) algorithms for the tasks of text infilling and part-of-speech (POS) prediction for natural language data. We construct new conformal prediction-enhanced bidirectional encoder representations from transformers (BERT) and bidirectional long short-term memory (BiLSTM) algorithms for POS tagging and a new conformal prediction-enhanced BERT algorithm for text infilling. We analyze the performance of the algorithms in simulations using the Brown Corpus, which contains over 57,000 sentences. Our results demonstrate that the ICP algorithms are able to produce valid set-valued predictions that are small enough to be applicable in real-world applications. We also provide a real data example for how our proposed set-valued predictions can improve machine generated audio transcriptions.


翻译:现代机器学习算法能够提供非常准确的点值; 但是,关于统计可靠性的问题仍然存在。 与常规的机器学习方法不同, 符合的预测算法返回了符合某一重要程度的一套信心( 定值预测 ) 。 此外, 这些信任组是有效的, 因为它们保证对第1类误差概率进行有限的抽样控制, 让执业者能够选择可接受的误差率 。 在我们的文件中, 我们提议对自然语言数据的文本填充和部分语音( POS)预测任务进行感应一致预测( ICP ) 算法 。 我们从变压器(BERT) 和双向长期短期内存(BILSTM) 算法中构建了新的符合的预测- 增强双向双向的双向编码算法 。 我们用布朗公司( Prown Corpus) 算法分析模拟算法的绩效, 包含57 000多条小句子。 我们的结果表明, 比较方案算法能够充分改进真实的定值预测。 我们的定值数据也能够提供正确的定值, 我们的定值的定值数据, 我们的定值的定值的定值的定值的定值可以提供正确的定值, 的定值数据能的模型的模型的模型的模型的模型的模型的模型可以提供出如何。

0
下载
关闭预览

相关内容

深度学习理论,55页ppt,Preetum Nakkiran (UCSD)
专知会员服务
32+阅读 · 2021年10月27日
专知会员服务
88+阅读 · 2021年6月29日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
95+阅读 · 2020年5月31日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
【资源】问答阅读理解资源列表
专知
3+阅读 · 2020年7月25日
NLG任务评价指标BLEU与ROUGE
AINLP
20+阅读 · 2020年5月25日
无监督元学习表示学习
CreateAMind
25+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Churn prediction in online gambling
Arxiv
0+阅读 · 2022年1月7日
Arxiv
6+阅读 · 2021年10月25日
Inductive Relation Prediction by Subgraph Reasoning
Arxiv
11+阅读 · 2020年2月12日
Arxiv
3+阅读 · 2018年9月12日
Arxiv
3+阅读 · 2018年2月20日
VIP会员
相关资讯
【资源】问答阅读理解资源列表
专知
3+阅读 · 2020年7月25日
NLG任务评价指标BLEU与ROUGE
AINLP
20+阅读 · 2020年5月25日
无监督元学习表示学习
CreateAMind
25+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Top
微信扫码咨询专知VIP会员