蛋白质语言模型已成为序列生成中的强大工具,在功能优化与全新蛋白设计(de novo design)方面展现出显著优势。然而,这类模型也面临生成有害蛋白质序列的重大风险,例如可能增强病毒传播能力或逃避免疫系统的序列。这些问题凸显了关键的生物安全与伦理挑战。 为应对上述问题,我们提出了一种基于知识引导的偏好优化框架(Knowledge-guided Preference Optimization, KPO),通过构建蛋白质安全知识图谱引入先验知识。该框架采用高效的图剪枝策略以识别优选序列,并结合强化学习机制,降低生成有害蛋白的风险。 实验结果表明,KPO 在保持蛋白功能性的同时,能够显著减少有害序列的生成概率,为生成模型在生物技术领域的安全应用提供了一个稳健的保障框架。