《人工智能 面向机器学习的数据标注规程》国家标准,本文件规定了面向机器学习的数据标注框架及流程。本文件适用于指导人工智能领域面向机器学习的数据标注以及与之相关的研究、开发和应用等。
本文件确立了面向机器学习的数据标注流程及框架。本文件适用于人工智能领域面向机器学习的数据标注以及与之相关的研究、 开发和应用等。本文件全面规范了以数据标注为主的实践与操作,适用于所有需要进行数据 标注的机构、高校、企业、单位等。本标准从初期计划、中期执行以及结果核查 和输出三个阶段,分别梳理指导性框架、要求与步骤。本文件共包含七大部分,即范围、规范性引用文件、术语和定义、数据标注 流程框架、标注任务前期准备、标注任务执行、标注结果输出。标注任务前期准 备为本标准的核心,详细介绍了如何定义所需数据、预估数据量、确定标注说明 规则、确定人力供给方式、选择工具或平台、执行标注任务、对结果进行质检和 质量控制、完成结果输出并最终交付。
主要内容
http://std.samr.gov.cn/gb/search/gbDetailed?id=91B707B3BE89F2B6E05397BE0A0AB1F8
在标注前期准备阶段,数据需求方和标注管理方应确定标注任务,完成标注内容和标注数据的确定。标注管理方评估标注任务,向数据需求方反馈是否需要变更需求,若需要则变更标注需求,并重新评估 标注任务。标注前期准备阶段还应根据标注人员的要求确定数据标注方,同时确定标注环境,选择合适 的标注工具和场景。在标注任务执行阶段,数据需求方、标注管理方及数据标注方三方人员应遵循标注 流程的过程控制,完成标注任务的创建、分发、开展及回收。同时应保证标注任务的质量,严格遵守管 理机制。在标注结果输出阶段,数据标注方应对数据标注方标注后的数据进行内部质检,质检合格后将 标注后的数据交付给数据需求方。若标注后的数据符合预期,则数据标注完成;否则进行后期维护环节, 数据标注方应对数据进行修正,并重启内部质检流程。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DLML” 就可以获取《《人工智能面向机器学习的数据标注规程》国家标准意见稿》专知下载链接