TabRet：基于 Transformer 的表格预训练模型，用于未见列 (TabRet: Pre-training Transformer-based Tabular Models for Unseen Columns) - 专知论文

会员服务 ·

0

预训练 · 变换 · 微调 · 预训练模型 · 表格数据 ·

2023 年 4 月 16 日

TabRet: Pre-training Transformer-based Tabular Models for Unseen Columns

翻译：TabRet：基于 Transformer 的表格预训练模型，用于未见列

Soma Onishi,Kenta Oono,Kohei Hayashi

from arxiv, Accepted at the Workshop on Understanding Foundation Models at ICLR 2023

We present \emph{TabRet}, a pre-trainable Transformer-based model for tabular data. TabRet is designed to work on a downstream task that contains columns not seen in pre-training. Unlike other methods, TabRet has an extra learning step before fine-tuning called \emph{retokenizing}, which calibrates feature embeddings based on the masked autoencoding loss. In experiments, we pre-trained TabRet with a large collection of public health surveys and fine-tuned it on classification tasks in healthcare, and TabRet achieved the best AUC performance on four datasets. In addition, an ablation study shows retokenizing and random shuffle augmentation of columns during pre-training contributed to performance gains. The code is available at https://github.com/pfnet-research/tabret .

翻译：我们提出了一种名为 \emph{TabRet} 的表格数据可预训练 Transformer 模型。TabRet 的设计目的是处理包含预训练中未见列的下游任务。与其他方法不同的是，TabRet 在微调之前有一个额外的学习步骤，称为 \emph{retokenizing}，它基于掩码自编码损失对特征嵌入进行校准。在实验中，我们使用了大量的公共卫生调查数据对 TabRet 进行了预训练，并在医疗保健分类任务中进行了微调，TabRet 在四个数据集中均获得了最佳的 AUC 表现。此外，一个消融研究表明，预训练期间的重标记化和随机洗牌增强对于性能提升起到了积极作用。该代码可在 https://github.com/pfnet-research/tabret 上获取。

0

相关内容

预训练

在搭建网络模型时，需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当参数训练到比较好的时候就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。

预训练模型如何用于文本挖掘？看这份KDD2021-UIUC《预训练文本表示:模型与应用在文本挖掘》教程，附200页Slides

专知会员服务

44+阅读 · 2021年8月18日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

预训练语言模型fine-tuning近期进展概述

预训练语言模型fine-tuning近期进展概述

专知会员服务

40+阅读 · 2021年4月9日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

321+阅读 · 2020年11月26日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

139+阅读 · 2020年7月10日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

166+阅读 · 2020年3月18日

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

专知会员服务

43+阅读 · 2019年11月25日

【Google论文】ALBERT:自我监督学习语言表达的精简BERT

【Google论文】ALBERT:自我监督学习语言表达的精简BERT

专知会员服务

24+阅读 · 2019年11月4日

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

AINLP

40+阅读 · 2019年6月9日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

20+阅读 · 2017年12月17日

二氮嗪拮抗软骨氧化损伤的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

光周期调节基因GmFT4在大豆中的功能研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于增量动力分析的高层及超高层结构抗震性能评估方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

半导体衬底上FeSe薄膜的外延生长及界面超导

国家自然科学基金

0+阅读 · 2013年12月31日

转录因子Ste12调控玉米大斑病菌侵染过程的分子机制

国家自然科学基金

0+阅读 · 2012年12月31日

Brd2调控胰岛B细胞增殖的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

弥漫大B细胞淋巴瘤中LMP1癌基因下调B细胞终末分化调控因子Blimp1基因的作用机制及预后预测研究

国家自然科学基金

0+阅读 · 2012年12月31日

血红素加氧酶HY1通过ABA信号途径调节拟南芥耐旱性的分子机理

国家自然科学基金

0+阅读 · 2012年12月31日

慢病毒介导SOX9基因高表达及基因沉默对间充质干细胞软骨分化影响的研究

国家自然科学基金

0+阅读 · 2009年12月31日

组蛋白乙酰化对分化中的心肌细胞Kir2.1的表达调控

国家自然科学基金

0+阅读 · 2009年12月31日

Can Large Pre-trained Models Help Vision Models on Perception Tasks?

Arxiv

0+阅读 · 2023年6月1日

Encoder-decoder multimodal speaker change detection

Arxiv

0+阅读 · 2023年6月1日

Unsupervised Anomaly Detection in Medical Images Using Masked Diffusion Model

Arxiv

0+阅读 · 2023年5月31日

LMCap: Few-shot Multilingual Image Captioning by Retrieval Augmented Language Model Prompting

Arxiv

0+阅读 · 2023年5月31日

Exploring Lottery Prompts for Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月31日

Saliency Map Verbalization: Comparing Feature Importance Representations from Model-free and Instruction-based Methods

Arxiv

0+阅读 · 2023年5月30日

Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes

Arxiv

22+阅读 · 2023年5月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

VIP会员

文章信息

相关主题

预训练模型

相关VIP内容

预训练模型如何用于文本挖掘？看这份KDD2021-UIUC《预训练文本表示:模型与应用在文本挖掘》教程，附200页Slides

专知会员服务

44+阅读 · 2021年8月18日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

预训练语言模型fine-tuning近期进展概述

预训练语言模型fine-tuning近期进展概述

专知会员服务

40+阅读 · 2021年4月9日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

321+阅读 · 2020年11月26日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

139+阅读 · 2020年7月10日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

166+阅读 · 2020年3月18日

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

专知会员服务

43+阅读 · 2019年11月25日

【Google论文】ALBERT:自我监督学习语言表达的精简BERT

【Google论文】ALBERT:自我监督学习语言表达的精简BERT

专知会员服务

24+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】面向企业的图学习扩展：生产级图学习与推理，485页pdf

AI智能体编程：技术、挑战与机遇综述

【国家标准】数据安全技术数据安全风险评估方法

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

相关资讯

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

AINLP

40+阅读 · 2019年6月9日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

20+阅读 · 2017年12月17日

相关论文

Can Large Pre-trained Models Help Vision Models on Perception Tasks?

Arxiv

0+阅读 · 2023年6月1日

Encoder-decoder multimodal speaker change detection

Arxiv

0+阅读 · 2023年6月1日

Unsupervised Anomaly Detection in Medical Images Using Masked Diffusion Model

Arxiv

0+阅读 · 2023年5月31日

LMCap: Few-shot Multilingual Image Captioning by Retrieval Augmented Language Model Prompting

Arxiv

0+阅读 · 2023年5月31日

Exploring Lottery Prompts for Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月31日

Saliency Map Verbalization: Comparing Feature Importance Representations from Model-free and Instruction-based Methods

Arxiv

0+阅读 · 2023年5月30日

Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes

Arxiv

22+阅读 · 2023年5月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

相关基金

二氮嗪拮抗软骨氧化损伤的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

光周期调节基因GmFT4在大豆中的功能研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于增量动力分析的高层及超高层结构抗震性能评估方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

半导体衬底上FeSe薄膜的外延生长及界面超导

国家自然科学基金

0+阅读 · 2013年12月31日

转录因子Ste12调控玉米大斑病菌侵染过程的分子机制

国家自然科学基金

0+阅读 · 2012年12月31日

Brd2调控胰岛B细胞增殖的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

弥漫大B细胞淋巴瘤中LMP1癌基因下调B细胞终末分化调控因子Blimp1基因的作用机制及预后预测研究

国家自然科学基金

0+阅读 · 2012年12月31日

血红素加氧酶HY1通过ABA信号途径调节拟南芥耐旱性的分子机理

国家自然科学基金

0+阅读 · 2012年12月31日

慢病毒介导SOX9基因高表达及基因沉默对间充质干细胞软骨分化影响的研究

国家自然科学基金

0+阅读 · 2009年12月31日

组蛋白乙酰化对分化中的心肌细胞Kir2.1的表达调控

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员