首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ACL 2022 | 基于长度感知注意机制的长度可控摘要模型

©作者 | 孙川 单位 | 阿里巴巴 研究方向 | 问答系统 编辑 | PaperWeekly 以往的长度可控摘要模型大多在解码阶段控制长度,而编码阶段对指定的摘要长度不敏感。...本文的方法是在由原始训练数据构建的摘要长度平衡数据集上训练 LAAM,然后像往常一样进行微调。结果表明,这种方法可以有效地生成具有所需长度的高质量摘要,甚至是原始训练集中从未见过的短长度摘要。...为了在不同的移动设备或空间有限的网站上显示摘要,我们必须生成不同长度的摘要。...长度可控的摘要是一个多目标优化问题,包括: 在期望的长度内生成完整的摘要 以及根据期望的长度选择适当的信息 相关方法 现有的基于编解码器模型的长度可控摘要可分为两类: 解码时的早停 编码前的信息选择...为了平衡摘要在不同长度范围内的分布,本文提出了一种启发式方法:首先定义摘要长度范围,然后从原文中直接抽取不同长度的摘要,根据特定指标控制抽取摘要的相关度,从而创建长度平衡数据集(LBD,length-balanced

98050
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python入门摘要

    摘要 本文讲解了Python语法的要点,便于入门者学习之用。 2.内容 2.1 基本语法 2.2.1 Python 标识符 在 Python 里,标识符由字母、数字、下划线组成。...2.3.2 字符串(str) python的字串列表有2种取值顺序: 从左到右索引默认0开始的,最大范围是字符串长度少1 从右到左索引默认-1开始的,最大范围是字符串开头 img 加号(+)是字符串连接运算符...以上实例我们使用了内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数。 range返回一个序列的数。...2.14 模块 Python 模块(Module),是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句。...当我输入"Hello Python!",它的输出如下: 请输入:Hello Python! 你输入的内容是: Hello Python!

    1.7K10

    Python计算文件或字符串的MD5SHA

    本文章讲如何通过Python实现计算文件或字符串的MD5, SHA1, SHA224, SHA256, SHA384, SHA512值。 ?...MD5功能 输入任意长度的信息,经过处理,输出为128位的信息(数字指纹); 不同的输入得到的不同的结果(唯一性); MD5算法的特点 压缩性:任意长度的数据,算出的MD5值的长度都是固定的 容易计算:...例如A写了一个文件,认证机构对此文件用MD5算法产生摘要信息并做好记录。若以后A说这文件不是他写的,权威机构只需对此文件重新产生摘要信息,然后跟记录在册的摘要信息进行比对,相同的话,就证明是A写的了。...对于长度小于2^64位的消息,SHA1会产生一个160位的消息摘要。当接收到消息的时候,这个消息摘要可以用来验证数据的完整性。.../zeruns/015317b1ddac1957b8d5ee3afad4ba90 # Python计算字符串或文件的MD5/SHA值 import time import os import hashlib

    2.4K20

    python hashlib模块安装_python hashlib 模块

    在python3中已经废弃了md5和sha模块 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。...摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。...比SHA1更安全的算法是SHA256、SHA384和SHA512,不过越安全的算法越慢,而且摘要长度更长。...sha256 = hashlib.sha256() sha256.update(‘123456’.encode(‘utf-8’)) print(sha256.hexdigest()) 计算出的摘要 8d969eef6ecad3c29a3a629280e686cf0c3f5d5a86aff3ca12020c923adc6c92...7cea57894be0879c73d39536cd13ead2 python 还有一个 hmac 模块,它内部对我们创建 key 和 内容 再进行处理然后再加密 import hmac h = hmac.new

    2.3K20

    python根据文章标题内容自动生成摘要

    文因互联很快根据金融机构的需求开发出了公告摘要、自动化报告、财报结构化数据等多个软件产品,并开发出了投研小机器人。 2016年年底,文因互联再次获得睿鲸资本Pre-A轮融资。...鲍捷举例说,深市、沪市、新三板加在一起每天平均大概3000-4000份公告,每天处理公告数据提取和摘要,这是一件非常繁琐的事情。很多金融机构要养20多人处理公告,而且这些人还不能快速高效准确地处理。...给机器程序输入金融知识,并通过模型训练,能够快速准确地提取各项公告摘要和年报摘要。 鲍捷表示,文因互联长远目标是Kensho,用人工智能提升金融投研效率和渠道效率,而这还有很长的路要走。...''' 方法一:根据标题内容生成摘要 # -*- coding: utf-8 -*- import jieba,copy,re,codecs from collections import Counter...3): sents_score = {} len_sentences = len(sentences) #**** 初始化句子重要性得分,并计算句子平均长度

    2.5K20

    常用模块 - hashlib模块

    一、简介 Python的hashlib提供了常见的摘要算法,如MD5、SHA1、SHA224、SHA256、SHA384、SHA512等算法。 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。...它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。...举个例子,你写了一篇文章,内容是一个字符串“how to use python hashlib – by mayi”,并附上这篇文章的摘要是“75b850b26f4e75b1ad3db76a255065f2...如果有人篡改了你的文章,并发表为“how to use python hashlib – by bob”,你可以一下子指定bob篡改了你的文章,因为根据“how to use python hashlib...c159ce3114fb4553683cf96d91db6d51080c02e8 print(hash.hexdigest()) 四、sha256加密 import hashlib hash = hashlib.sha256

    64050

    盘点Python加密解密模块hashlib的7种加密算法

    前言 在程序中我们经常可以看到有很多的加密算法,比如说MD5 sha1等,今天我们就来了解下这下加密算法的吧,在了解之前我们需要知道一个模块嘛就是hashlib,他就是目前Python一个提供字符加密的模块...是计算机广泛使用的杂凑算法之一(又译摘要算法、哈希算法),主流编程语言普遍已有MD5实现。将数据(如汉字)运算为另一固定长度值,是杂凑算法的基础原理,MD5的前身有MD2、MD3和MD4。...MD5算法具有以下特点: 1、压缩性:任意长度的数据,算出的MD5值长度都是固定的。 2、容易计算:从原数据计算出MD5值很容易。...MD5的作用是让大容量信息在用数字签名软件签署私人密钥前被"压缩"成一种保密的格式(就是把一个任意长度的字节串变换成一定长的十六进制数字串)。...sha224.hexdigest() print("sha224加密结果:",res) 四、sha256 安全散列算法 import hashlib string='任性的90后boy' sha256 = hashlib.sha256

    2.1K30
    领券