成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Hacking
关注
4
综合
百科
VIP
热门
动态
论文
精华
RRM: Robust Reward Model Training Mitigates Reward Hacking
Arxiv
0+阅读 · 2月27日
Can LLMs Hack Enterprise Networks? Autonomous Assumed Breach Penetration-Testing Active Directory Networks
Arxiv
0+阅读 · 2月6日
LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks
Arxiv
0+阅读 · 2月18日
MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking
Arxiv
0+阅读 · 1月22日
LLM Agent Honeypot: Monitoring AI Hacking Agents in the Wild
Arxiv
0+阅读 · 2月10日
PenTest++: Elevating Ethical Hacking with AI and Automation
Arxiv
0+阅读 · 2月13日
Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment
Arxiv
0+阅读 · 1月16日
SoK: A Review of Cross-Chain Bridge Hacks in 2023
Arxiv
0+阅读 · 1月6日
Generative Artificial Intelligence-Supported Pentesting: A Comparison between Claude Opus, GPT-4, and Copilot
Arxiv
0+阅读 · 1月12日
When Can Proxies Improve the Sample Complexity of Preference Learning?
Arxiv
1+阅读 · 2024年12月21日
4.5 Million (Suspected) Fake Stars in GitHub: A Growing Spiral of Popularity Contests, Scams, and Malware
Arxiv
1+阅读 · 2024年12月18日
Security Properties for Open-Source Hardware Designs
Arxiv
1+阅读 · 2024年12月16日
Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking
Arxiv
1+阅读 · 2024年12月12日
Security Properties for Open-Source Hardware Designs
Arxiv
1+阅读 · 2024年12月11日
Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data
Arxiv
0+阅读 · 2024年12月9日
参考链接
父主题
黑客 (Hacker)
网络安全
计算机安全
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top