业界 | 随机森林算法预测法官判决,准确度优于人类水平

选自Science

作者: Matthew Hutson

机器之心编译

参与:蒋思源

近日,Science 报道了一种利用最高法院数据库和随机森林算法构建的法官判决预测系统,该系统在判决预测上甚至要比法律专家还准得多。以前机器之心就曾对话过首个致力于法律服务的人工智能创业公司 Ross Intelligence,这一次是人工智能应用于法律的新进展。

「最高法院见!」唐纳德·特朗普总统在上周为回应地方法院对国家安全政策的看法而发推文这样说。但把这样一个案件直接递送到最高法院是一个好主意吗?人工智能可能会很快就给出答案。一项新研究表明,即使在信息比较少的情况下,计算机也能比法律学者更好地预测最高法院的判决。

还有其他一些研究也通过算法预测法官的判决行为。例如在 2011 项目中,其使用了 1953 年到 2004 年任意八名法官的投票来预测同一个案件下第九名法官的判决,该系统实现了 83% 的准确度。而另一篇 2004 年发表的论文通过使用 1994 年以来一直在法院工作的法官及其判决来预测 2002 年案件的判决结果,该系统实现了 75% 的准确度。

而现在新的研究利用更丰富的数据集预测任意法官在任何时候的判决。研究者们使用的是最高法院数据库,该数据库包含的信息甚至可以追溯到 1791 年处理的案件。利用这一大型数据库,研究者们构建了一个通用型算法,该算法可以预测任何法官在任何时间所做的判决。研究者们将每一个判决使用 16 个特征表达,其包括了法官、时期、问题和原审判法院等信息。同时他们还增加了一些特征,如口头辩论是否有旁听者等情况。

该团队利用 1816 年到 2015 年的数据建立了一个称之为随机森林的统计机器学习模型。该模型通过查看以往的数据以找出案件特征和判决结果之间的联系。模型预测的判决结果包括是否撤销地方法院的裁决以及每一个法官是如何判决的。然后模型通过查看该年份每一个案例的特征预测可能的判决结果。最后,该算法会学习预测的结果,这样以更新以后判决的策略。

从 1816 年到 2015 年,算法正确地预测了法院 28000 项决议中的 70.2%,法官 240000 次判决中的 71.9%,该数据是论文作者在 PLOS ONE 中所报告的。该算法击败了最高法院流行的策略「总是推翻」,推翻策略在过去 35 期最高法院的判决中占了 63%。同样该随机森林算法也要比直接使用过去 10 年的经验而自动预测「推翻」与「维持原判」这一策略要好。2004 年的研究发现,即使是知识渊博的法律专家,他们在预测案件的准确度也只有 66%。该研究的主要作者,芝加哥伊利诺伊理工大学法学教授 Daniel Katz 说:「每一次我们在预测案件的时候,人类很难做到准确。」

西班牙依维尔基里大学的物理学家 Roger Guimera 和 2011 项目的主要作者都说新算法「严谨而优良」。密歇根大学政治学家 Andrew Martin 作为 2004 年项目研究的作者,他评论新团队所建立的算法在两个世纪以来的数据上运行优秀。他说:「新研究团队正在创造真正的大数据集并使用最先进的算法,这对科学来说十分重要。」

走出实验室,银行家和律师可能将此算法投入到实际应用中。投资者也会对可能在裁决中受益的公司进行投资。而上诉者也可以根据是否有胜算而向最高法院提出诉讼。Katz 说:「而那些经常讨论这些案件的律师也将受益良多。」

律师还能将不同的变量加入到模型中以获得最可能上诉成功的路径,这些变量就包括了哪些地方法院上诉的成功率高或哪些才是合适的原告人。芝加哥肯特学院法学研究联合作者 Michael Bommarito 在美国独立企业联盟(National Federation of Independent Business v. Sebelius)就提出过一个真实的案例,其中美国平价医疗法案已经正式推行:「其中令其真正有趣的是:平价医疗法案是关于自由言论,关于税收或某种健康权益问题吗?」而现在,算法可以帮助原告人哪些问题才是最重要的。

判决预测算法的未来应该包括口头辩论的全文文本或专家预测。Katz 说:「我们相信法律专家、大众和算法的融合是解决判决预测问题的关键。」

论文地址:http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0174698

基于机器学习的发展和先前司法判决预测科学的研究,我们构建了一个可以预测美国最高法院(Supreme Court of the United States)判决行为的通用算法。为此,我们开发了一个随时间演化的随机森林分类器,并且利用其独特的特征工程预测了近两个世纪(1816-2015 年)的 240000 项判决和 28000 项案件结果。我们在决策之前只使用可获得的数据,并在参数和非参数测试下,模型在判决和案件层面上都优于基线(null/baseline)模型。在近两个世纪的数据中,我们在案件结果层面实现了 70.2% 的准确度,司法判决层面实现了 71.9% 的准确度。最近,我们利用近一个世纪的数据实现了比样本优化零模型(in-sample optimized null model)近 5% 的优化。我们的研究与先前预测保持一致,并提升了一般预测的水平。然而,我们的模型是独特的,因为其可以应用于整个最高法院过去和未来的样本,而不是单一的时期。因此我们的研究成果代表了定量法律预测科学的重要进步,并展示了一系列潜在的应用。

表 1:预测结果的分布(1816-2015)

图 1:案件和司法判决准确度(1816-2015)

原文链接:http://www.sciencemag.org/news/2017/05/artificial-intelligence-prevails-predicting-supreme-court-decisions

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-05-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

科普: 神经网络的黑盒不黑

神经网络 ? 当然, 这可不是人类的神经网络, 因为至今我们都还没彻底弄懂人类复杂神经网络的运行方式. 今天只来说说计算机中的人工神经网络. 我们都听说过, ...

2966
来自专栏机器之心

李飞飞高徒:斯坦福如何打造基于视觉的智能医院?

每年,死于医院内感染的人数比车祸还要多。这意味着去医院就医比不去医院病情加重的概率要高 1/30。

741
来自专栏ATYUN订阅号

深度学习帮助医生对乳腺癌肿瘤进行分类,准确度为82%

在美国,有超过310万有乳腺癌病史的女性。今年,预计将有超过266,000名女性被诊断患有浸润性乳腺癌。为了帮助医生更好地检测和治疗这种疾病,研究人员开始寻求A...

1872
来自专栏崔庆才的专栏

重磅福利!腾讯 AI Lab 开源大规模高质量中文词向量数据,800 万中文词随你用!

今日,腾讯 AI Lab 宣布开源大规模、高质量的中文词向量数据。该数据包含 800 多万中文词汇,相比现有的公开数据,在覆盖率、新鲜度及准确性上大幅提高,为对...

2263
来自专栏量子位

Hinton反思新作:我说反向传播不好,但还是没谁能颠覆它

1353
来自专栏AI科技大本营的专栏

机器学习的学习随想01

【AI100 导读】本文是作者在学习机器学习的过程中随手记下的一些随想,内容涉及数学原理、算法分析、系统设计和产业趋势,脑洞随时开放,思路经常穿越,采取微博文体...

3565
来自专栏量子位

年度必看AI论文:生成式非对抗网络(停止对抗,用爱学习)

震惊!(本次使用已获UC震惊部授权) 就在昨天,人工智能领域一个开创性的成果出现了:关于生成对抗网络(GAN)的最新论文出炉。很多学者和业内人士,都用震惊二字描...

3764
来自专栏新智元

薛定谔的佛与深度学习中的因果

作者:王庆法,中国东信CTO 【新智元导读】最近流行佛系XXX,殊不知深度学习里也有佛。本文是继《薛定谔的滚与深度学习中的物理》一文后,笔者又一心力之作。从神秘...

3545
来自专栏新智元

荐书 | Christopher Bishop 新书:基于模型的机器学习

【新智元导读】机器学习大牛Christopher Bishop的新书《基于模型的机器学习》近日推出了抢先预览版,用浅显的生活实例介绍了机器学习中的多个经典概念,...

3647
来自专栏数据派THU

【独家】一文读懂文字识别(OCR)

前言 文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分 本文将以上图为主要线索,简要阐述在文字识别领域中的各个组成部...

2.3K8

扫码关注云+社区

领取腾讯云代金券