成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
模型性能
关注
2
综合
百科
VIP
热门
动态
论文
精华
ConvXformer: Differentially Private Hybrid ConvNeXt-Transformer for Inertial Navigation
Arxiv
0+阅读 · 10月22日
Adapting Language Balance in Code-Switching Speech
Arxiv
0+阅读 · 10月21日
EvaLearn: Quantifying the Learning Capability and Efficiency of LLMs via Sequential Problem Solving
Arxiv
0+阅读 · 10月21日
Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence
Arxiv
0+阅读 · 10月18日
Evolving LLMs' Self-Refinement Capability via Iterative Preference Optimization
Arxiv
0+阅读 · 10月20日
MiLQ: Benchmarking IR Models for Bilingual Web Search with Mixed Language Queries
Arxiv
0+阅读 · 10月19日
HUME: Measuring the Human-Model Performance Gap in Text Embedding Tasks
Arxiv
0+阅读 · 10月20日
Privacy-Preserving Dataset Combination
Arxiv
0+阅读 · 10月17日
MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production
Arxiv
0+阅读 · 10月17日
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models
Arxiv
0+阅读 · 10月16日
MX+: Pushing the Limits of Microscaling Formats for Efficient Large Language Model Serving
Arxiv
0+阅读 · 10月16日
MetaBench: A Multi-task Benchmark for Assessing LLMs in Metabolomics
Arxiv
0+阅读 · 10月16日
Benefits and Limitations of Communication in Multi-Agent Reasoning
Arxiv
0+阅读 · 10月14日
A Methodology for Assessing the Risk of Metric Failure in LLMs Within the Financial Domain
Arxiv
0+阅读 · 10月16日
A Methodology for Assessing the Risk of Metric Failure in LLMs Within the Financial Domain
Arxiv
0+阅读 · 10月15日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top