蛋白质语言模型已成为序列生成中的强大工具,在功能优化与全新蛋白设计(de novo design)方面展现出显著优势。然而,这类模型也面临生成有害蛋白质序列的重大风险,例如可能增强病毒传播能力或逃避免疫系统的序列。这些问题凸显了关键的生物安全与伦理挑战。 为应对上述问题,我们提出了一种基于知识引导的偏好优化框架(Knowledge-guided Preference Optimization, KPO),通过构建蛋白质安全知识图谱引入先验知识。该框架采用高效的图剪枝策略以识别优选序列,并结合强化学习机制,降低生成有害蛋白的风险。 实验结果表明,KPO 在保持蛋白功能性的同时,能够显著减少有害序列的生成概率,为生成模型在生物技术领域的安全应用提供了一个稳健的保障框架。

成为VIP会员查看完整内容
10

相关内容

【CVPR2025】个性化视觉与语言生成
专知会员服务
9+阅读 · 5月1日
【ICML2024】理解视觉-语言模型的检索增强任务适应
专知会员服务
20+阅读 · 2024年5月3日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【CVPR2025】个性化视觉与语言生成
专知会员服务
9+阅读 · 5月1日
【ICML2024】理解视觉-语言模型的检索增强任务适应
专知会员服务
20+阅读 · 2024年5月3日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员