蛋白质语言模型已成为序列生成中的强大工具,在功能优化与全新蛋白设计(de novo design)方面展现出显著优势。然而,这类模型也面临生成有害蛋白质序列的重大风险,例如可能增强病毒传播能力或逃避免疫系统的序列。这些问题凸显了关键的生物安全与伦理挑战。 为应对上述问题,我们提出了一种基于知识引导的偏好优化框架(Knowledge-guided Preference Optimization, KPO),通过构建蛋白质安全知识图谱引入先验知识。该框架采用高效的图剪枝策略以识别优选序列,并结合强化学习机制,降低生成有害蛋白的风险。 实验结果表明,KPO 在保持蛋白功能性的同时,能够显著减少有害序列的生成概率,为生成模型在生物技术领域的安全应用提供了一个稳健的保障框架。

成为VIP会员查看完整内容
0

相关内容

【CVPR2025】个性化视觉与语言生成
专知会员服务
8+阅读 · 5月1日
【ACL2024】通过直接偏好优化的自训练提升链式思维推理
【ICML2024】理解视觉-语言模型的检索增强任务适应
专知会员服务
20+阅读 · 2024年5月3日
【SIGMOD2023】大规模地理空间分析:问题、挑战与机遇,
专知会员服务
18+阅读 · 2023年7月9日
【MBSE】基于MBSE的正向设计和产品创新
产业智能官
19+阅读 · 2020年5月1日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
472+阅读 · 2023年3月31日
Arxiv
171+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员