法律人工智能因其高效、便捷的特点,近年来受到社会各界的广泛关注。法律文书是法律在社会生活中最常 见的表现形式,应用自然语言理解方法智能地处理法律文书内容是一个重要的研究和应用方向。该文梳理与总结 面向法律文书的自然语言理解技术,首先介绍了五类面向法律文书的自然语言理解任务形式:法律文书信息提取、 类案检索、司法问答、法律文书摘要和判决预测。然后,该文探讨了运用现有自然语言理解技术应对法律文书理解 的主要挑战,指出需要解决好法律文书与日常生活语言之间的表述差异性、建模好法律文书中特有的推理与论辩 结构,并且需要将法条、推理模式等法律知识融入自然语言理解模型。
http://jcip.cipsc.org.cn/CN/abstract/abstract3366.shtml
随着我国依法治国方略的实施,社会法治进程 稳步前进,通过法律手段维护社会公平正义、维护个 体权益已成为社会日常生活的重要组成。随之而来 的,则是法律领域从业人员需要处理的案件量显著 提升。据统计,我国各级人民法院一年受理诉讼案 件总数已超过3000万件[1],这对司法系统的稳定 运行提出了巨大挑战。法律人工智能将人工智能技 术应用于法律领域,可以在案件处理过程中为法律 从业者提供智能化服务,提升其工作实效。因此,近 年来法律人工智能技术受到学术界与产业界的广泛 关注。 法律案件审理过程的各个环节记录都会用文字 归档,相关法条法规及司法解释等官方文件也通常以文本形式呈现。这些以文本形式呈现的法律相关 文档统称为法律文书。法律文书是实施法律的重要 手段,忠实地记录着各类法律活动。在法律人工智 能中,面向法律文书的自然语言理解技术有着较高 的研究价值与广泛的应用前景。 自然语言理解技术在法律文书上有丰富的应用 场景,如类案检索、智能辅助司法裁判以及司法问答 系统等。 类案检索系统通过提供智能化的关键信息抽取 服务和文书检索服务,减轻了法律从业者在处理法 律文书方面的工作量,提升了整个司法环节的效率。 不同于基于浅层文本匹配的文书检索系统,智能文 书检索系统利用深度学习模型,引入法律要素、争议 焦点等法律知识,理解法律文书的深层语义信息,能 够提供更为准确和个性化的检索结果。 在司法裁判过程中,智能辅助系统可以提供包 含推理过程、可解释的判决预测结果,并附上相关统 计分析数据,为法官提供有价值的参考信息,提高其 工作效率,维护司法公正。 司法问答系统可以为更广泛的人群提供法律咨 询服务,让普通群众无须掌握专业的法律知识,也无 须支付高昂的法律咨询服务费用,依然能够便捷地 了解和学习法律知识,同时也降低了普通群众运用 法律维护自身权益的门槛。 自然语言理解技术在法律文书上的应用场景主 要涉及法律文书信息抽取、类案检索、司法问答、法 律文书摘要和判决预测五个任务。本文在第1节系 统地介绍了这些任务的形式,研究现状及难点。在 第2节中,本文针对处理法律文书面临的主要技术 挑战展开了深入分析和讨论,指出目前主要的挑战 包括:①处理法律文书中的语言与日常生活语言间 的表述差异性;②建模法律文书中特有的推理与论 辩内容;③将法条、推理模式等法律知识融入自然 语言理解模型的学习和预测过程。 法律文书一般指具有普遍约束力的规范性法律 文件(法律法规等)以及由国家司法机关、律师等依 法制作的具有法律效力的文件。表1展示的刑事案 件判决书就是一种常见的法律文书。不同于日常生 活中常见的文本,法律文书通常为半格式化文本,具 有一定的结构。例如表1的案件判决书包含案情描 述、法庭判决、相关法条等章节。在内容上,法律文 书以叙议为内容主体,具有层次分明的论辩结构,并 含有大量法律概念。这些特点要求面向法律文书的自然语言理解模型能够处理法律文书的常见结构, 理解法律概念,甚至应对一些推理任务。