成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-2
关注
0
综合
百科
VIP
热门
动态
论文
精华
Revisiting the Othello World Model Hypothesis
Arxiv
0+阅读 · 3月6日
YNote: A Novel Music Notation for Fine-Tuning LLMs in Music Generation
Arxiv
0+阅读 · 2月12日
Comparing Unidirectional, Bidirectional, and Word2vec Models for Discovering Vulnerabilities in Compiled Lifted Code
Arxiv
0+阅读 · 2月18日
AI-generated Text Detection with a GLTR-based Approach
Arxiv
0+阅读 · 2月17日
AutoScale: Automatic Prediction of Compute-optimal Data Composition for Training LLMs
Arxiv
1+阅读 · 2024年12月16日
Superficial Consciousness Hypothesis for Autoregressive Transformers
Arxiv
1+阅读 · 2024年12月10日
The Asymptotic Behavior of Attention in Transformers
Arxiv
0+阅读 · 2024年12月3日
Investigating Sensitive Directions in GPT-2: An Improved Baseline and Comparative Analysis of SAEs
Arxiv
0+阅读 · 2024年11月18日
Evaluating Synthetic Activations composed of SAE Latents in GPT-2
Arxiv
0+阅读 · 2024年11月18日
Learning from Implicit User Feedback, Emotions and Demographic Information in Task-Oriented and Document-Grounded Dialogues
Arxiv
0+阅读 · 2024年11月9日
Investigating Sensitive Directions in GPT-2: An Improved Baseline and Comparative Analysis of SAEs
Arxiv
0+阅读 · 2024年10月16日
AutoScale: Automatic Prediction of Compute-optimal Data Composition for Training LLMs
Arxiv
0+阅读 · 2024年10月13日
Sparse Attention Decomposition Applied to Circuit Tracing
Arxiv
0+阅读 · 2024年10月10日
How Language Models Prioritize Contextual Grammatical Cues?
Arxiv
0+阅读 · 2024年10月4日
Modelando procesos cognitivos de la lectura natural con GPT-2
Arxiv
0+阅读 · 2024年9月30日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top