成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
语言模型化
关注
9
综合
百科
VIP
热门
动态
论文
精华
Instructor-Worker Large Language Model System for Policy Recommendation: a Case Study on Air Quality Analysis of the January 2025 Los Angeles Wildfires
Arxiv
0+阅读 · 10月9日
Disambiguation-Centric Finetuning Makes Enterprise Tool-Calling LLMs More Realistic and Less Risky
Arxiv
0+阅读 · 10月9日
CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards
Arxiv
0+阅读 · 10月9日
More Than One Teacher: Adaptive Multi-Guidance Policy Optimization for Diverse Exploration
Arxiv
0+阅读 · 10月9日
Language Surgery in Multilingual Large Language Models
Arxiv
0+阅读 · 10月9日
PLUM: Adapting Pre-trained Language Models for Industrial-scale Generative Recommendations
Arxiv
0+阅读 · 10月9日
DeepPrune: Parallel Scaling without Inter-trace Redundancy
Arxiv
0+阅读 · 10月9日
HySim-LLM: Embedding-Weighted Fine-Tuning Bounds and Manifold Denoising for Domain-Adapted LLMs
Arxiv
0+阅读 · 10月9日
Towards Proprioception-Aware Embodied Planning for Dual-Arm Humanoid Robots
Arxiv
0+阅读 · 10月9日
Watch your steps: Dormant Adversarial Behaviors that Activate upon LLM Finetuning
Arxiv
0+阅读 · 10月9日
On the Relationship Between the Choice of Representation and In-Context Learning
Arxiv
0+阅读 · 10月9日
Generation and annotation of item usage scenarios in e-commerce using large language models
Arxiv
0+阅读 · 10月9日
DACIP-RC: Domain Adaptive Continual Instruction Pre-Training via Reading Comprehension on Business Conversations
Arxiv
0+阅读 · 10月9日
Investigating Thematic Patterns and User Preferences in LLM Interactions using BERTopic
Arxiv
0+阅读 · 10月8日
A Survey of Reinforcement Learning for Large Reasoning Models
Arxiv
0+阅读 · 10月9日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top