自然语言生成(Natural Language Generation, NLG)是在自然语言理解、图像识别和视频分 析等技术基础上利用人工智能和语言学方法生成自然语言文本的过程,近年来成为人工智能研究 领域的热点,在军事领域也得到了较好的应用。文中提出了 NLG 技术的应用框架体系,阐述了文 本到文本、数据到文本、图片到文本和视频到文本 4 个大类的关键技术和实现方法;归纳总结了机 器翻译、辅助撰写、智能问答、战场监视、侦察解译等 11 个典型场景,为 NLG 技术在军事领域的实 战化应用提供方向;从军事领域数据集缺失、现有 NLG 系统的实用性和抗毁性不足等方面,深入剖 析了制约 NLG 技术军事应用的瓶颈问题,并提出对策建议,为 NLG 技术在军事领域的未来发展提。 伴随着信息时代的发展,海量文本、数据、图片、 视频等信息充斥着军事领域各个环节和链路。这些 信息数据量大、非结构化、利用率低、聚合能力差,加 之各岗位人员数量有限,信息处理难度与日俱增,保 障压力越来越大。自然语言生成(Natural Language Generation,NLG) 作为人工智能和自然语言处理 (Natural Language Processing,NLP) 领域的关键技 术,近年来得到了飞速发展,为解决当前出现的各种 保障难题提供了可能。美、英、法等国家的军方大力 资助民间公司和研究机构从事这一领域的研发工 作,开发了一系列 NLG 系统[1] ,将其融入到武器装 备和作战行动中,大大提高了军事行动的效率。本 文首先对 NLG 技术的主要研究内容和方法进行介 绍;然后,对 NLG 技术当前以及未来在军事领域的 典型应用进行详细探讨;最后,对一些制约应用发展 的问题挑战进行简要剖析,希望能够为 NLG 研究领 域的学者专家及工程技术人员开发更多支撑备战打 仗现实需要的技术和应用提供一些借鉴。
NLG 技术应用的体系框架通常可分为数据层、 前端技术层、生成技术层、应用层 4 个方面,如图 1 所示。数据层分为原始数据和标注数据两类,其中 原始数据是指未按标准或规范经过专门标注的数据, 标注数据是指按标准或规范经过专门标注的数据;前 端技术层分为自然语言理解、图像识别、视频分析三个 方面,是支撑文本生成的基础技术;生成技术层按照不 同的输入类别划分,分为文本到文本的生成、数据到文 本的生成、图像到文本的生成和视频到文本的生成四 类;应用层主要根据具体领域设计相关模块。
自然语言生成技术在军事领域的应用
NLG 技术具有极为广泛的应用价值,目前已在 医疗、电商、工业、教育、新闻传播等多个领域[17] 蓬 勃发展。随着军事大数据的逐步积累,依托大数据 处理、人工智能、云计算等平台支撑,在军事领域已 陆续出现诸多落地落实的具体应用。军事领域需求 必将成为推动 NLG 技术快速发展的重要引擎,为提 高备战打仗智能化、自动化、高效化水平,打赢信息 化战争助力。军事领域 NLG 技术应用总体框架如 图 2 所示。