预训练论文 - 专知

会员服务 ·

预训练

在搭建网络模型时，需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当参数训练到比较好的时候就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。

Decorrelation Speeds Up Vision Transformers

Arxiv

0+阅读 · 10月16日

MIO: A Foundation Model on Multimodal Tokens

Arxiv

0+阅读 · 10月16日

The Art of Scaling Reinforcement Learning Compute for LLMs

The Art of Scaling Reinforcement Learning Compute for LLMs

Arxiv

0+阅读 · 10月15日

Roboflow100-VL: A Multi-Domain Object Detection Benchmark for Vision-Language Models

Arxiv

0+阅读 · 10月8日

Beyond Gloss: A Hand-Centric Framework for Gloss-Free Sign Language Translation

Arxiv

0+阅读 · 9月1日

Beyond Gloss: A Hand-Centric Framework for Gloss-Free Sign Language Translation

Arxiv

0+阅读 · 7月31日

PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis

PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis

Arxiv

0+阅读 · 3月31日

UniWav: Towards Unified Pre-training for Speech Representation Learning and Generation

Arxiv

0+阅读 · 3月2日

Low Fidelity Visuo-Tactile Pretraining Improves Vision-Only Manipulation Performance

Arxiv

0+阅读 · 3月13日

VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge

Arxiv

0+阅读 · 3月4日

Yi-Lightning Technical Report

Arxiv

0+阅读 · 1月22日

Has this Fact been Edited? Detecting Knowledge Edits in Language Models

Arxiv

0+阅读 · 2月10日

Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale

Arxiv

0+阅读 · 2月14日

Pre-training, Fine-tuning and Re-ranking: A Three-Stage Framework for Legal Question Answering

Arxiv

0+阅读 · 2024年12月27日

MIO: A Foundation Model on Multimodal Tokens

Arxiv

0+阅读 · 1月13日

参考链接

微信扫码咨询专知VIP会员