专栏首页arxiv.org翻译专栏大文件的法则:用视觉线索理解法律合同的结构

大文件的法则:用视觉线索理解法律合同的结构

像BERT这样的大型预训练变压器模型已经在文档理解任务上取得了最先进的结果,但大多数实现一次只能考虑512个令牌。对于许多实际的应用程序,文档可能更长,通常用于较长的文档的分段策略忽略了文档结构和上下文信息,从而影响了它们对下游任务的结果。在我们关于法律协议的工作中,我们发现诸如布局、风格和文档中的文本放置等视觉提示是重要的特征,对于长文档达到可接受的准确性水平是至关重要的。我们测量了合并这些视觉线索(通过计算机视觉方法获得)对文档理解任务(包括文档分割、实体提取和属性分类)的准确性的影响。在契约理解Atticus数据集上,我们基于结构元数据的文档分割方法在四个长文档理解任务上的性能优于现有方法。

原文标题:The Law of Large Documents: Understanding the Structure of Legal Contracts Using Visual Cues

Large, pretrained transformer models like BERT have achieved state-of-the-art results on document understanding tasks, but most implementations can only consider 512 tokens at a time. For many real-world applications, documents can be much longer, and the segmentation strategies typically used on longer documents miss out on document structure and contextual information, hurting their results on downstream tasks. In our work on legal agreements, we find that visual cues such as layout, style, and placement of text in a document are strong features that are crucial to achieving an acceptable level of accuracy on long documents. We measure the impact of incorporating such visual cues, obtained via computer vision methods, on the accuracy of document understanding tasks including document segmentation, entity extraction, and attribute classification. Our method of segmenting documents based on structural metadata outperforms existing methods on four long-document understanding tasks as measured on the Contract Understanding Atticus Dataset.

原文链接:https://arxiv.org/pdf/2107.08128.pdf

原文作者:Allison Hegel, Marina Shah, Genevieve Peaslee

我来说两句

0 条评论
登录 后参与评论

相关文章

  • CVPR 2020 最佳论文提名 | 神经网络能否识别镜像翻转

    2020年让我们不断见识到“后浪”的超强力量,也让世界看到了瞩目的华人新星。在今年6月举办的CVPR中,年龄最小的一位一作获奖者甚至还在本科阶段。他就是来自康奈...

    公众号机器学习与生成对抗网络
  • 高管必备思维:区分2类问题和4类可视化方法

    大数据文摘
  • 人工智能作曲、算法作曲指南

    为了探索AI自动生成音效的方法,我“抓”了limber一块完成了此篇内容,给大家介绍算法作曲相关的技术,涉及生成艺术相关的技术、产品、体验,着重梳理了核心技术及...

    mixlab
  • Science:对时-频调制的不同敏感性支持了大脑对旋律和语音的不对称处理

    语音和音乐是人类对声音最复杂、最独特的认知方式。这两个领域在多大程度上依赖于可分离的神经机制?这种专业化的神经基础是什么?对于这两个问题,虽然已经有了部分认识,...

    用户1279583
  • 斯坦福学者:生物智能可能是解决AI发展瓶颈的关键

    最初的类人智能出现在几百万年前的非洲大陆,并持续进化,最终在大约 10 万年前,在我们人类这一物种——智人的大脑中达到顶峰。

    新智元
  • 剖析,平面设计中的板式构成

    所谓版式设计,就是在版面上,将有限的视觉元素进行有机的排列组合,将理性思维个性化地表现出来、一种具有个人风格和艺术特色的视觉传送方式,传达信息的同时,也产生感官...

    宇相
  • 探码大数据采集系统让数据可视化变得更简单!

    数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。步入大数据时代,各行各业对数据的重视程度与日俱增,随...

    用户5290619
  • 业界 | 让机器学会创造新的概念:DeepMind提出符号-概念关联网络SCAN

    选自DeepMind Blog 机器之心编译 参与:李泽南、李亚洲 让人工智能像人类一样理解世界一直是研究者们努力的方向。最近,DeepMind 在这条路上又向...

    机器之心
  • 超级快速阅读

    yeedomliu
  • AI一分钟 | 今天,百度又多了一个好基友华为,还互赠了信物;腾讯AI Lab“肢体动作追踪”技术造出了个“AI 尬舞机”

    图片来源:凤凰网科技 一分钟AI 地平线面向智能驾驶和智能摄像头,推出征程和旭日两款嵌入式人工智能视觉芯片。 百度Apollo无人车队雄安开跑,河北省政府与百度...

    AI科技大本营
  • 机器视觉表面缺陷检测综述

    中国是一个制造大国,每天都要生产大量的工业产品。用户和生产企业对产品质量的要求越来越高,除要求满足使用性能外,还要有良好的外观,即良好的表面质量。但是,在制造产...

    智能算法
  • how we learn 学习笔记 2 学习的七个定义

    这些心智模型的丰富性,在很大程度上是无意识的,超出了我们的想象。例如,你拥有一个巨大的语言思维模型,身体模型,各种外部交互模型(游戏、手机),

    用户1908973
  • 美的计算 | 生成艺术创新设计的边界

    媒介和技术的发展使设计艺术打破了原本界限:从静到动到可交互,从二维到三维到沉浸体验,技术结合设计形成的审美价值在未来是无止境的。视觉设计师们普遍形成了不断从文...

    腾讯ISUX
  • 皮质运动兴奋性不受中央区mu节律相位的调节

    在正式阅读文章之前,请随小编一起了解下本研究的大Boss:MU节律,到底是什么。mu-rhythm(mu节律),出现在中央区或Rolandic区,如下图所示:

    用户1279583
  • 【精选案例】灵活的版式造就视觉盛宴

    《腾讯网UED体验设计之旅》是腾讯网UED十年精华输出的干货型读物,从用户研究、创意剖析、绘制方法、项目管理等实体案例出发,解读了网媒用户分析与研究方法、门户网...

    博文视点Broadview
  • 北大心理与认知学院院长方方:人类注意力图和动态机制

    6月22日,北京智源大会举行了认知神经基础专题论坛,来自北京师范大学认知神经科学与学习国家重点实验室的毕彦超教授、北京大学心理与认知科学学院的方方教授、北京师范...

    脑机接口社区
  • 北大心理与认知学院院长方方:人类注意力图和动态机制

    6月22日,北京智源大会举行了认知神经基础专题论坛,来自北京师范大学认知神经科学与学习国家重点实验室的毕彦超教授、北京大学心理与认知科学学院的方方教授、北京师范...

    AI科技评论
  • BCI--脑电基础整理

    脑机接口(BCI),是一种通过检测中枢神经系统活动并将其转化为人工输出,来替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而改变中枢神经系统与内外环境之...

    MiChong
  • 从机器学习谈起

    机器学习[Machine Learning]在当今社会的火热程度有目共睹,自己也一直想写一下自己对Machine Learning(简称ML)的认识,今天偶然看...

    流川枫

扫码关注云+社区

领取腾讯云代金券