作者:朱明徳
全文共 4686 字 9 图,阅读需要 10 分钟
———— / BEGIN / ————
有人说,“人工智能训练师”是AI给人类带来的第一个非技术类“新职位”,这也许能让大家对AI多一些客观认知、甚至是好感;不过这个新职位,AI领域从业者的认知度还不高——
AI公司为什么要设立这样一个职位
职责边界是什么
什么样的人适合
职位发展前景如何
等等问题,都还是业内空白,为此我将在正文中为大家一一揭晓。
人工智能训练师的定义:通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现“提高数据标注工作的质量和效率”以及“积累细分领域通用数据”的价值。
人工智能训练师的行业认知度:开始得到杭州、北京等城市2年以上AI公司的重视,考虑到人工智能训练师的人才缺口5年后将增长20倍以上,该职位将会愈加受到各家AI公司的重视。
人工智能训练师的职业规划:1~3岁互联网产品经理最有可能成为人工智能训练师的主要来源职位;而AI产品经理将成为最合适的上升职位。
人工智能训练师的产生背景
人工智能训练师是什么
人工智能训练师的人才缺口
人工智能训练师的职业规划
结语
一般而言,AI公司从客户(用户)那里获取到的原始数据无法直接用于模型训练,在“人工智能训练师”出现以前,是由AI产品经理先用相关工具简单处理,再交给数据标注人员进行标注加工,但因为标注人员对数据的理解和标注质量差异很大,导致整体标注工作的效率和效果都不够理想。
同时,AI公司在其细分领域内积累了大量数据,这些数据往往在使用一次后就不再产生更多价值,随之带来了第二个问题:数据无法沉淀和复用。
基于这两个问题,“人工智能训练师”应运而生。
* 注:“人工智能训练师”这个职位,据说最早是由BAT某部门在2年前创造的。
人工智能训练师,是通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现“提高数据标注工作的质量和效率”以及“积累细分领域通用数据”的价值,从工作流和工作难度等角度看,它介于数据标注和AI产品经理之间。
人工智能训练师的工作职责,主要有以下三点:
提供数据标注规则:通过算法聚类、标注分析等方式,从数据中提取行业特征场景,并结合行业知识,提供表达精准、逻辑清晰的数据标注规则,最终确保数据训练效果能满足产品的需求;
数据验收及管理:参与模型搭建和数据验收,并负责核心指标和数据的日常跟踪维护;
积累领域通用数据:根据细分领域的数据应用要求,从已有数据中挑选符合要求的通用数据(适用于同领域内不同客户/用户),形成数据的沉淀和积累。
* 注:在不同公司,人工智能训练师的职责具有一定差异性,比如有的偏重前期的数据挖掘和模型训练,有的偏重后期的产品运营和产品体验。
人工智能训练师和数据标注、AI产品经理的异同
1)人工智能训练师和AI产品经理的异同
人工智能训练师需要和AI产品经理讨论需求,进而制定数据标注规则,并提出产品体验优化建议。
2)人工智能训练师和数据标注的异同
人工智能训练师需要和数据标注人员紧密协作,把控好整个流程的输入规则和输出结果,最终输出标注准确的数据(供模型训练)。
3)人工智能训练师的工作流程图
下图,展示了人工智能训练师和数据标注、AI产品经理协作的工作流及其每个节点的交付物。
不难发现:人工智能训练师在数据标注和AI产品经理之间,起到桥梁的作用。
人工智能训练师和初级互联网数据产品经理的异同
1)两者工作职责的主要区别在于“积累细分领域通用数据”,这项工作将为公司创造新的价值,比如:
大大减少后续标注人员的工作量,提升业务的接入速度和效率。
逐步建立细分领域的行业壁垒。
总之,由于一般的数据不能全领域通用,所以不同应用场景下,细分领域通用数据少的问题,将成为整个行业的痛点和机会。
2)在AI工作场合,原本由初级互联网数据PM完成的“贡献数据采集标准、打通数据资源、数据应用的推广”等工作,并没有交给人工智能训练师,而是由更适合的AI产品经理完成,原因在于这部分工作更偏重前端的需求和推广(AI产品经理更熟悉和擅长产品体验及流程)。
基于人工智能训练师的工作职责,需要具备哪些能力呢?
通过调研分析,我们总结出了如下的能力模型:
数据能力:了解科学的数据获取方法论,能运用数据处理工具(如 Excel等),逻辑思维强。
行业背景:熟悉公司行业领域知识,特别是语言或图像方面数据的特点。
分析能力:基于产品的数据需求,及时发现、提炼问题特征,产出优化方案和建议。
沟通能力:具备较强与不同岗位同事同频交流的能力,能通俗易懂的阐释专业术语信息。
AI技术理解力:能够厘清基本的AI概念,并了解其技术边界(能做什么和不能做什么)。
AI行业理解力:具备AI行业知识(如了解行业术语)或相关产品运营经验,在此基础上能够预判行业趋势、深挖场景痛点、设计AI方案。
暂未形成明显的人才缺口,因为一方面,大部分公司都是近期才开始设立这个职位,人才需求量不多(不超过三位数);另一方面,目前大多数人才需求,通过公司内部运营人员转岗和外部招聘就能满足。
1)人工智能训练师的职位画像
工作经验:大公司的要求明显高于创业公司,一般在三年以上
工资范围:主要集中在8k以下
2)人工智能训练师的公司画像
发展较为成熟的智能客服类公司,对于人工智能训练师的需求量明显领先于其它行业。
出人意料的,杭州AI公司表现出了更高的敏锐度(有4家公司,和北京并列第一),背后原因可能是政府的大力推动:
* 原文链接:《杭州人社局:人工智能训练师将有机会享受落户加分等福利》
成立2年以上的公司(73%)更需要人工智能训练师,一般情况早期创业公司侧重搭建产品技术框架、验证解决方案和商业模式,没过多精力放在“提升效率”或“积累细分领域通用数据”上,所以“人工智能训练师”对于需控制团队规模、降低管理成本和风险的早期创业公司而言,非必需单独拆分的职位。
已上市和A轮的公司,相对而言对人工智能训练师的需求量更大。
另外需要说明的是,按道理CV(计算机视觉)领域也有数据标注工作,但我们搜索了10多家(计算机视觉)领域公司的招聘页面,暂时都没有发现人工智能训练师的需求,这可能是因为相对“标注语料数据”,“标注图像数据”更简单,主要找外包公司即可完成。
* 注:以上结论,来自对15家公司职位描述信息的分析汇总。
1)未来5年人才缺口将增长20倍以上
在即将到来的2018年,人工智能训练师的人才缺口预计将达到近1000人;
两年后的2020年,伴随着AI行业的高速成长,人才缺口也将随之猛增至2018年的四倍,达到近4000人;
按照这个发展趋势,到2022年人才缺口将突破2万人,相当于职位自然流入人才数量的四倍左右,人才缺口越来越大,需要引起行业的足够重视。
2)职位画像和公司画像在未来可能发生的变化
CV(计算机视觉)领域公司可能也会逐步建立自己的人工智能训练师团队。因为随着CV领域商业化越来越成熟,各家公司对于数据标注的质量和效率要求会越来越高,甚至数据需求的CV领域可能会越来越细分,进而导致外包数据标注公司可能满足不了。
成立年限小于2年的AI公司,可能会更加重视招募人工智能训练师。
因为一方面,这个职位的行业认知度在逐渐提升;另一方面,更重要的是各家公司会越来越意识到,在业务初期,细分领域的某些数据就能提升用户价值,并同时建立初步的行业壁垒。
随着大部分AI创业公司逐渐完成产品验证,所服务的行业领域越来越多,市场将进入快速增长期,构建数据方面的行业壁垒(积累领域数据、提升数据标注效率等),将逐渐成为一种趋势,而“人工智能训练师”正好能满足这些需求,在未来几年会得到各家公司更多的重视与关注。
从行业现状看,无论是外部招聘还是内部转岗,绝大部分人工智能训练师的应聘者都不具备AI相关的专业或行业背景,因此在人才选拔时,公司会更看重数据和产品相关经验,人才来源主要有以下三类:
内部转岗:从客服等和数据有关的运营岗位中平级转岗;
内部转岗:从数据标注员中择优提拔;
外部招聘:从有1年以上互联网产品经验的产品经理中招聘筛选。
而这3个来源之中,目前1~3岁互联网产品经理就有4~5万(并且由于互联网产品经理已经供大于需,他们正面临找工作的压力);另一方面,一般1岁以上的互联网PM,能力也已经可以胜任人工智能训练师了。
综上所述:1~3岁互联网产品经理将最有可能成为人工智能训练师的主要人才来源。
* 注:1~3岁互联网产品经理的数量,由四个基础数据估算得出(2016年底互联网从业者人数、2016年底互联网从业者人数同比增长率、产品经理从业者人数占比、3年以下工作经验从业者人数占比),数据取自拉勾网《2016年互联网职场生态白皮书》和经纬&猎聘《互联网人才 360° 印象报告》。
职位创造价值更大:AI产品经理更关注整体的产品体验和商业价值,对于公司能产出更大的价值。;
职位能力要求更高:在数据分析能力、相关行业经验基础上,还需要具备AI技术理解力、AI人机交互设计、AI行业理解力等更高阶的能力素质。
综合来看,从人工智能训练师转型AI产品经理大约需要6~12个月的时间,出色的工作表现和抓住时机的决心将在转型过程中将起到决定性作用。
附:一个真实转型案例
SY同学,从数据标注转型到AI产品经理,花费了6个月,这应该是最快的速度了,因为她的每一步都是能力刚刚ready时,公司就有内部转岗或借调使用的headcount机会。
刚入职,具有超高工作质量与效率,明显高出其他同期入职同事
1个月后,指导其他兼职标注人员
3个月后 ,公司内其他部门有AI产品助理空缺,正好内部借调(从产品助理工作开始)
6个月后,正式转型AI产品经理
1)个人介绍:
朱明德,3年互联网电商PM经验,正转型AI产品经理。最近正在寻找“人工智能训练师”相关工作,坐标上海(苏州、杭州亦可),目标薪酬10k-15k。
2)指导顾问:
黄钊hanniman,图灵机器人-人才战略官,前腾讯产品经理,5年AI实战经验,8年互联网背景,微信公众号/知乎/在行ID“hanniman”,饭团“AI产品经理大本营”,分享人工智能相关原创干货,200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。
本报告得到诸多同行大力支持。
特别感谢指导顾问 图灵机器人@黄钊 老师在写作和调研过程中提供的帮助和建议(前后30多天时间里,针对10多个修改版本的文章框架和排版细节,总计提了300+个建议;并且帮助邀请了不少其他AI公司的调研对象)。
感谢四位大力配合的调研对象:图灵机器人@郑殊予、追一科技@刘杰 以及另2位不便署名的同行;
还要感谢@Shertin 对报告提出的修改意见。
———— / END / ————
作者:朱明德
指导顾问:黄钊
本文原创发布于人人都是产品经理。未经许可,禁止转载
点击“阅读原文”下载APP