成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
数据监管
关注
0
综合
百科
VIP
热门
动态
论文
精华
Analyzing Similarity Metrics for Data Selection for Language Model Pretraining
Arxiv
0+阅读 · 10月21日
Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs
Arxiv
0+阅读 · 10月21日
OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM
Arxiv
0+阅读 · 10月17日
Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs
Arxiv
0+阅读 · 10月15日
Pharmacist: Safety Alignment Data Curation for Large Language Models against Harmful Fine-tuning
Arxiv
0+阅读 · 10月11日
Iterative Data Curation with Theoretical Guarantees
Arxiv
0+阅读 · 10月13日
STIV: Scalable Text and Image Conditioned Video Generation
Arxiv
0+阅读 · 10月6日
Waver: Wave Your Way to Lifelike Video Generation
Arxiv
0+阅读 · 8月21日
Waver: Wave Your Way to Lifelike Video Generation
Arxiv
0+阅读 · 8月26日
Tackling fluffy clouds: robust field boundary delineation across global agricultural landscapes with Sentinel-1 and Sentinel-2 Time Series
Arxiv
0+阅读 · 6月26日
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning
Arxiv
0+阅读 · 6月5日
Do Chinese models speak Chinese languages?
Arxiv
0+阅读 · 4月7日
Active Data Curation Effectively Distills Large-Scale Multimodal Models
Arxiv
0+阅读 · 5月5日
We Need Improved Data Curation and Attribution in AI for Scientific Discovery
Arxiv
0+阅读 · 4月3日
OpenCodeReasoning: Advancing Data Distillation for Competitive Coding
Arxiv
0+阅读 · 4月2日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top