业界 | 随机森林算法预测法官判决,准确度优于人类水平

2017 年 5 月 3 日 机器之心

选自Science

作者: Matthew Hutson

机器之心编译

参与:蒋思源


近日,Science 报道了一种利用最高法院数据库和随机森林算法构建的法官判决预测系统,该系统在判决预测上甚至要比法律专家还准得多。以前机器之心就曾对话过首个致力于法律服务的人工智能创业公司 Ross Intelligence,这一次是人工智能应用于法律的新进展。



「最高法院见!」唐纳德·特朗普总统在上周为回应地方法院对国家安全政策的看法而发推文这样说。但把这样一个案件直接递送到最高法院是一个好主意吗?人工智能可能会很快就给出答案。一项新研究表明,即使在信息比较少的情况下,计算机也能比法律学者更好地预测最高法院的判决。


还有其他一些研究也通过算法预测法官的判决行为。例如在 2011 项目中,其使用了 1953 年到 2004 年任意八名法官的投票来预测同一个案件下第九名法官的判决,该系统实现了 83% 的准确度。而另一篇 2004 年发表的论文通过使用 1994 年以来一直在法院工作的法官及其判决来预测 2002 年案件的判决结果,该系统实现了 75% 的准确度。


而现在新的研究利用更丰富的数据集预测任意法官在任何时候的判决。研究者们使用的是最高法院数据库,该数据库包含的信息甚至可以追溯到 1791 年处理的案件。利用这一大型数据库,研究者们构建了一个通用型算法,该算法可以预测任何法官在任何时间所做的判决。研究者们将每一个判决使用 16 个特征表达,其包括了法官、时期、问题和原审判法院等信息。同时他们还增加了一些特征,如口头辩论是否有旁听者等情况。


该团队利用 1816 年到 2015 年的数据建立了一个称之为随机森林的统计机器学习模型。该模型通过查看以往的数据以找出案件特征和判决结果之间的联系。模型预测的判决结果包括是否撤销地方法院的裁决以及每一个法官是如何判决的。然后模型通过查看该年份每一个案例的特征预测可能的判决结果。最后,该算法会学习预测的结果,这样以更新以后判决的策略。


从 1816 年到 2015 年,算法正确地预测了法院 28000 项决议中的 70.2%,法官 240000 次判决中的 71.9%,该数据是论文作者在 PLOS ONE 中所报告的。该算法击败了最高法院流行的策略「总是推翻」,推翻策略在过去 35 期最高法院的判决中占了 63%。同样该随机森林算法也要比直接使用过去 10 年的经验而自动预测「推翻」与「维持原判」这一策略要好。2004 年的研究发现,即使是知识渊博的法律专家,他们在预测案件的准确度也只有 66%。该研究的主要作者,芝加哥伊利诺伊理工大学法学教授 Daniel Katz 说:「每一次我们在预测案件的时候,人类很难做到准确。」


西班牙依维尔基里大学的物理学家 Roger Guimera 和 2011 项目的主要作者都说新算法「严谨而优良」。密歇根大学政治学家 Andrew Martin 作为 2004 年项目研究的作者,他评论新团队所建立的算法在两个世纪以来的数据上运行优秀。他说:「新研究团队正在创造真正的大数据集并使用最先进的算法,这对科学来说十分重要。」


走出实验室,银行家和律师可能将此算法投入到实际应用中。投资者也会对可能在裁决中受益的公司进行投资。而上诉者也可以根据是否有胜算而向最高法院提出诉讼。Katz 说:「而那些经常讨论这些案件的律师也将受益良多。」


律师还能将不同的变量加入到模型中以获得最可能上诉成功的路径,这些变量就包括了哪些地方法院上诉的成功率高或哪些才是合适的原告人。芝加哥肯特学院法学研究联合作者 Michael Bommarito 在美国独立企业联盟(National Federation of Independent Business v. Sebelius)就提出过一个真实的案例,其中美国平价医疗法案已经正式推行:「其中令其真正有趣的是:平价医疗法案是关于自由言论,关于税收或某种健康权益问题吗?」而现在,算法可以帮助原告人哪些问题才是最重要的。


判决预测算法的未来应该包括口头辩论的全文文本或专家预测。Katz 说:「我们相信法律专家、大众和算法的融合是解决判决预测问题的关键。」



论文地址:http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0174698


基于机器学习的发展和先前司法判决预测科学的研究,我们构建了一个可以预测美国最高法院(Supreme Court of the United States)判决行为的通用算法。为此,我们开发了一个随时间演化的随机森林分类器,并且利用其独特的特征工程预测了近两个世纪(1816-2015 年)的 240000 项判决和 28000 项案件结果。我们在决策之前只使用可获得的数据,并在参数和非参数测试下,模型在判决和案件层面上都优于基线(null/baseline)模型。在近两个世纪的数据中,我们在案件结果层面实现了 70.2% 的准确度,司法判决层面实现了 71.9% 的准确度。最近,我们利用近一个世纪的数据实现了比样本优化零模型(in-sample optimized null model)近 5% 的优化。我们的研究与先前预测保持一致,并提升了一般预测的水平。然而,我们的模型是独特的,因为其可以应用于整个最高法院过去和未来的样本,而不是单一的时期。因此我们的研究成果代表了定量法律预测科学的重要进步,并展示了一系列潜在的应用。 


表 1:预测结果的分布(1816-2015)


图 1:案件和司法判决准确度(1816-2015)



原文链接:http://www.sciencemag.org/news/2017/05/artificial-intelligence-prevails-predicting-supreme-court-decisions


点击阅读原文,报名参与机器之心 GMIS 2017 ↓↓↓

登录查看更多
0

相关内容

面向司法案件的案情知识图谱自动构建
专知会员服务
126+阅读 · 2020年4月17日
专知会员服务
20+阅读 · 2020年3月29日
金融时序预测中的深度学习方法:2005到2019
专知会员服务
167+阅读 · 2019年12月4日
常用的模型集成方法介绍:bagging、boosting 、stacking
GLUE排行榜上全面超越BERT的模型近日公布了!
机器之心
9+阅读 · 2019年2月13日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
已删除
生物探索
3+阅读 · 2018年2月10日
教程 | 理解XGBoost机器学习模型的决策过程
机器之心
6+阅读 · 2017年12月20日
三大特征选择策略,有效提升你的机器学习水准
深度学习世界
8+阅读 · 2017年10月24日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
8+阅读 · 2018年1月12日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关资讯
常用的模型集成方法介绍:bagging、boosting 、stacking
GLUE排行榜上全面超越BERT的模型近日公布了!
机器之心
9+阅读 · 2019年2月13日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
已删除
生物探索
3+阅读 · 2018年2月10日
教程 | 理解XGBoost机器学习模型的决策过程
机器之心
6+阅读 · 2017年12月20日
三大特征选择策略,有效提升你的机器学习水准
深度学习世界
8+阅读 · 2017年10月24日
Top
微信扫码咨询专知VIP会员