明确风险词包、相似性检索、分类模型、风险知识图谱 4种手段适合完成的任务,且相互配合。
把风险词包从分类模型中拆出来,降低应用的复杂度,以及模型迭代的频率,解决稳定性问题。
分类模型的结构尽可能统一,标准尽可能不变,持续把效果做强。
自从 BERT 提出以来,NLP 问题的基本范式从原来的 task-specific 的模型结构设计转变到语言模型 pretrain+ 下游任务 finetuning 的模式。工作重点应该转向预训练模型与知识蒸馏。
团队的四项基本能力:连接、生产、传播、服务,其中“传播”就需要技术影响力。
CRO 线的使命“四心”中,有一条叫“让监管单位放心”。技术影响力是让监管放心的有效方式之一。
商业化需要资质:搞过投标的同学都知道。
招聘需要名气:对候选人讲解我们的技术水平时,如果用内部业务举例,不容易产生共鸣;但是如果直接亮出顶会论文、刷榜名次之类的,对方马上就懂了。
个人的市场价值需要证明:这些东西都可以作为个人技术品牌,到哪都能带着。