成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
BIG-bench
关注
0
综合
百科
VIP
热门
动态
论文
精华
Instruction Matters, a Simple yet Effective Task Selection Approach in Instruction Tuning for Specific Tasks
Arxiv
0+阅读 · 4月25日
Toolink: Linking Toolkit Creation and Using through Chain-of-Solving on Open-Source Model
Arxiv
0+阅读 · 3月18日
How predictable is language model benchmark performance?
Arxiv
0+阅读 · 1月9日
LLMs cannot find reasoning errors, but can correct them!
Arxiv
0+阅读 · 1月9日
How Predictable Are Large Language Model Capabilities? A Case Study on BIG-bench
Arxiv
0+阅读 · 2023年10月31日
Self-ICL: Zero-Shot In-Context Learning with Self-Generated Demonstrations
Arxiv
0+阅读 · 2023年10月23日
S3Eval: A Synthetic, Scalable, Systematic Evaluation Suite for Large Language Models
Arxiv
0+阅读 · 2023年10月23日
Can ChatGPT Defend its Belief in Truth? Evaluating LLM Reasoning via Debate
Arxiv
0+阅读 · 2023年10月10日
Large Language Models as Optimizers
Arxiv
0+阅读 · 2023年9月7日
AutoHint: Automatic Prompt Optimization with Hint Generation
Arxiv
0+阅读 · 2023年8月8日
Invalid Logic, Equivalent Gains: The Bizarreness of Reasoning in Language Model Prompting
Arxiv
0+阅读 · 2023年7月20日
AutoHint: Automatic Prompt Optimization with Hint Generation
Arxiv
0+阅读 · 2023年7月13日
Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models
Arxiv
0+阅读 · 2023年6月12日
Are Emergent Abilities of Large Language Models a Mirage?
Arxiv
1+阅读 · 2023年5月22日
Can ChatGPT Defend the Truth? Automatic Dialectical Evaluation Elicits LLMs' Deficiencies in Reasoning
Arxiv
1+阅读 · 2023年5月22日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top