中国科学院大学大数据联合实验室法律大数据突破3000万条

2018年1月,中国科学院大学大数据联合实验室(下称大数据联合实验室)已完成第一阶段海量法律文书数据收集工作。

大数据联合实验室负责人,中国科学院虚拟经济与数据科学研究中心主任石勇教授介绍道:“目前实验室收集的有效公开法律文书已突破3000万条。”

根据中国裁判文书网的数据,目前全国公开的有效法律文书总量为4000多万条,这表示大数据联合实验室收集的有效公开法律文书数据,已经覆盖了全国公开的有效法律文书数据的75%以上。

大数据联合实验室于2017年7月,由中国科学院虚拟经济与数据科学研究中心和华海乐盈网络科技集团联合成立,从成立以来就开始了紧锣密鼓的大数据研究工作。

作为法律大数据研究的具体实施单位,华海乐盈网络科技集团旗下专注开发互联网法律平台的子公司深圳法义网络科技有限公司历时半年,成功收集全国有效公开法律文书数据突破3000万条。

大数据联合实验室的研究工作在规划上分为数据准备、数据处理和数据分析三个阶段。数据准备是法律大数据研究工作的起点,在数据收集的基础上,对数据进行清洗和整理。

在完成这个阶段的工作后,大数据联合实验室将创立法律数据库,并开放入口普惠民众。实验室将利用自然语言处理技术,结合实验室积累的丰富的法律数据,开发基于中文语义的法律文书检索引擎。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180130C0RNZ100?refer=cp_1026

扫码关注云+社区