首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【数据】开源 | XL-Sum,一个全面和多样化数据,包括来自BBC100万专业注释文章-摘要对,涵盖44种语言

当代关于抽象文本摘要研究主要集中在像英语这样高资源语言上,这主要是因为低/中资源语言数据可用性有限。...在这项工作中,我们提出了XL-Sum,一个全面和多样化数据,包括来自BBC100万专业注释文章-摘要对,使用一套精心设计启发式提取。...该数据涵盖了从低资源到高资源44种语言,其中许多语言目前没有公共数据可用。XL-Sum具有高度抽象性、简练性和高质量。...我们使用XL-Sum对目前最先进预训练多语言模型mT5进行了微调,并对多语言和低资源摘要任务进行了实验。...与使用类似的单语言数据获得结果相比,XL-Sum得出了具有竞争力结果:在我们基准测试10种语言上,我们显示出高于11分ROUGE-2分数,其中一些超过了多语言训练获得15分。

72210
您找到你想要的搜索结果了吗?
是的
没有找到

开源日报 0825 | 简化开发过程,提升Swift应用性能扩展工具库

扩展集合,为 iOS、macOS、tvOS、watchOS 和 Linux 提供了方便方法、语法糖和性能改进。...所有扩展都遵循原始 Swift API 设计准则,并且旨在增强 Swift 功能性和开发效率。 此外,SwifterSwift 还具有以下核心优势: 通过提供大量实用工具函数来简化代码编写。...兼容各种平台 (iOS、macOS 等) 以及不同版本 Swift 语言。...该库需要使用您帐户密钥进行配置,并且具有以下主要功能和核心优势: 可以通过调用聊天完成端点来调用对话模型。 可以通过调用完成端点来调用文本模型。 可以使用嵌入方法获取文本字符串嵌入表示。...,通过语音和文本使来自不同语言社区的人们能够轻松交流。

25920

AI 在爱奇艺视频广告中探索

前情提要:自动从上一筛选并拼接多个小片段,能够对上一内容做摘要,称为前情提要,在前情提要上可以贴广告。它是无中生有去制造出来,可以根据广告主要求自动生成不同前情提要,作为广告点位。...视频图谱 怎么实现对视频更进一步理解,以下面的例子为主,我们可以从视觉、听觉、文本打各式各样标签,也可以从部分到整体可以打上各种标签;有了这些底层标签之后,我们需要能达到满足2个需求: ① 怎么去表达抽象概念...,训练方法足够好,它就越有可能去逼近这些标注数据,虽然我们也会做一些非监督类算法,但这些模型学到知识都是来自于训练数据,这些训练数据都是一个领域范围内数据,通过这些数据,我们会学习到哪些视频片段有什么样行为...前情提要贴生产逻辑 对每一剪辑出一个几十秒片段集锦,它是一个兼顾内容价值和商业价值一款产品。...首先需要体现内容价值: ① 前情提要要精彩,精彩是一个抽象概念,可以拆为感官层面和情节层面;同时需要具有代表性,涵盖剧情关键结点; ② 转场点识别,主要分为场景/镜头和对话两方面,不能出现镜头/场景突然切换

1.2K30

如何用TensorFlow和Swift写个App识别霉霉?

喜爱之情难以言表,于是利用机器学习技术开发了一款iOS 应用,可以随时随地识别出 Taylor Swift~~~ 不卖关子了,妹子开发这款应用效果如下: ?...下面我会分享从收集“霉霉”照片到制作使用预训练模型识别照片 iOS 应用大体步骤: 预处理照片:重新调整照片大小并打上标签,然后切分成训练和测试,最后将照片转为 Pascal VOC 格式 将照片转为...第一步:预处理照片 首先我从谷歌上下载了 200 张 Taylor Swift 照片,然后将它们分成两个数据:训练和测试。然后给照片添加标签。测试用于测试模型识别训练中未见过照片准确率。...你还需要输入一个边界框,可以识别出物体在照片中位置,以及和边界框相关标签(在我们数据集中,只用到一个标签:tswift,也就是 Taylor Swift)。...给 Taylor Swift 照片打标签,搞得从我旁边路过的人都以关爱智障眼神望着我)。

12.1K10

iOS 多国语言本地化与App内语言切换(Swift)写在前面前言准备工作storyboardxib本地化纯代码本地化语言切换后记

勾选语言,把几种全部勾上,包括Base (为下文使用脚本生成代码做准备) 参考此篇文章进行脚本添加 iOS多语言本地化流程优化 ? 添加脚本 将脚本执行移动到编译上方 ?...中文本转为swift格式常量,存入一个临时文件 sed "s/^\"/ static var localized_/g" "${localizableFile}" | sed "s/\" = \"...,否则会报错 build一下就能自动生成相关代码 就可以直接用了,具体用法可以参考上面提到那篇文章 iOS多语言本地化流程优化 语言切换 语言切换基本原理是使用Userdefault存储当前选择语言...(根据个人习惯修改) localizedFile="${SRCROOT}/Public/LocalizedUtils.swift" # 将localizable.strings中文本转为swift格式常量...参考文章: http://www.cocoachina.com/ios/20170809/20190.html

2.3K31

中文世界又多一个评测语言大模型能力基准CUGE,覆盖17种主流NLP任务

编辑:杜伟 覆盖更多语言能力、任务和数据,智源研究院为中文社区带来了一个全新语言理解和生成评测基准——智源指数。 在自然语言处理(NLP)领域,预训练模型刷榜已经成为行业惯例。...GLUE 、CLUE 等基准成为衡量大模型语言智能进展重要标准。 但应看到,GLUE、CLUE 等偏重于语言理解能力,对语言生成、多语言、数学推理等其他重要语言能力有所忽视。...种语言能力下,智源指数涵盖了 17 个主流自然语言处理任务,可以总结如下: 语言理解 - 词句级:中文分词、中文分词和词性标注、古诗文识记、命名实体识别、实体关系抽取; 语言理解 - 篇章级:幽默检测、故事情节完形填空...、阅读理解; 信息获取及问答:反向词典、开放域问答、文档检索; 语言生成:摘要生成、数据到文本生成; 对话交互:知识驱动对话生成; 多语言:机器翻译、跨语言摘要; 数学推理:数值计算。...智源指数排行榜也很有特色,比如使用多类型标签刻画数据特点,支持用户通过标签筛选定制排行榜,利用雷达图直观可视化模型在不同语言能力得分。智源指数支持单数据排行榜,便于研究者追踪数据研究进展动态。

1.3K10

单语言表征如何迁移到多语言去?

文本还发布了一个新评测数据(XQuAD), 它是一个更全面的跨语言基准测试,包括由专业翻译人员翻译成十种语言240段和1190对问题回答。...论文设计方法 假设有两种语言L1和L2,L1既有大量无标签数据又有下游任务监督数据,L2只有大量无标签数据,整个流程可分为一下四步: 在L1无标签数据上,训练一个单语bert,任务为masked...冻结第1步训练好bert中transformer部分(embedding层和softmax层除外),在L2无标签数据上从头开始训练新bert模型,任务同1。...实验2: MLDoc: DocumentClassification 文本分类数据和PAWS-X: ParaphraseIdentification 数据。 ?...为了更好理解这些模型跨语言泛化能力,创建了一个新评测数据 XQuAD ,由240个段落和1190个来自于v1.17开发问答对组成,并将它们翻译成10种语言:西班牙语、德语、希腊语,俄语,土耳其语

49410

XcodeXcode 9 全新功能您会喜欢工具。内建 Interface BuilderXcode IDE

基于 Swift 4 兼容性,Xcode 9 使用同一个编译器来构建已有的 Swift 3 代码和最新 Swift 4 代码。从此,数据迁移节奏,您说了算。...Swift 4 得助于 Apple 领导 Swift.org 开源社区, Swift构建过程非常高速,同时,它也能生产出运行更快 app 及体积更小可执行文件。...进一步了解 Swift 4 无线调试,剪断束缚 选择本地网络上任何 iOS 或 tvOS 设备来安装、运行和调试您 app,而无需使用 USB 线连接您 Mac。...每个标签都有自己导航器、编辑器、助理和实用工具布置区域。您可以为特定任务创建命名标签,重新排列标签,或撤销标签以创建独立窗口。...Apple Event Bridge 让您使用与 AppleScript 相同消息架构来命令并查询由 Objective-C、Ruby 和 Python 等更多语言构建 app。

8.3K30

肘子 Swift 周报 #028 |用 iPhone 感受像素游戏快乐!

这个周日,我收到了来自 MadMachine[4] SwiftIO Playground Kit[5],一款配备 600MHz MCU、32MB RAM 和 16MB Flash 开发板。...这款应用以其与众不同交互方式给我留下了深刻印象。《语境词典》是一个快速而精确多语言词典,通过大型语言模型根据词语具体上下文来解释新词汇。...How to migrate an iOS app to Bazel[16] Brentley Jones[17] Bazel 是一个开源多语言构建系统,广泛应用于大型项目和代码库中。...文章以 Mastodon iOS 项目作为实例,涵盖了从使用 swift_library 和 ios_application 等规则到利用远程缓存和执行优化构建性能多个方面。...Leonardo Pugliese 这篇文章探讨了 iOS 开发者在使用 Swift枚举时常见几个错误,包括映射值时缺乏凝聚力、懒惰 Switch 和默认子句误用,以及错误地假设自动原始值递增

7500

【干货】手把手教你用苹果Core ML和Swift开发人脸目标识别APP

本文将带你从最初数据处理开始教你一步一步实现一个“霉霉”检测器,来自动从一堆手机照片中找出“霉霉”。专知内容组编辑整理。...我用它来构建了上图中Taylor Swift检测器。 在这篇文章中,我概述了从一组TSwift格式图像到一个iOS app建立步骤,该app在一个训练好模型对测试图像进行预测; 1....我发现有一个Chrome扩展程序,可以下载Google种搜索所有图片结果。 在标记图像之前,我将它们分成两个数据:训练和测试。使用测试测试模型准确性。...▌第4步:使用Firebase和Swift构建预测客户端 ---- ---- 我在Swift中编写了一个iOS客户端来对我模型进行预测请求(因为为什么不用其他语言编写TSwift检测器?)...最后,在我iOS应用程序中,可以监听图像Firestore路径更新。如果检测到,我会下载图像,并与检测分数一起显示在应用程序中。这个函数将替换上面第一个Swift代码片段中注释: ?

14.7K60

深度学习图像识别项目(下):如何将训练好Kreas模型布置到手机中

class_labels = class_labels :在这里,我们提供了我们模型所训练标签。我们从LabelBinarizer对象中获得了class_label。...第10-12行为这个项目导入了三个必需包。 UIKit包是开发iOS应用程序视图通用框架,容许文本,按钮,表格视图,和导航。...现在我们已经导入了相关框架,下一步创建 ViewController 类(从一个文本标签开始): ?...真长,让人回想起我在Java编程日子! 在这门课上,我们首先要定义一个 UILabel ,它将保存我们标签和相关性概率百分比文本。 16-23行处理这一步骤。...预测标签可以通过Observation.identifier提取(第85行)。我们还规定confidence仅显示两位小数(第86行)。我们用这两个组件设置label 文本(89-91行)。

5.3K40

iOS之深入解析Xcode 13正式版发布40个新特性

; 现在可以在 Interface Builder 场景中预览以下辅助功能设置:动态类型、粗体文本、按钮形状、开/关标签、增加对比度和降低透明度; 现在可以启用 UILabel showsExpansionTextWhenTruncated...Transparency 框架重置受保护资源“用户跟踪”授权状态; 用 Swift 编写测试方法可能会被标记为异步或异步抛出,以允许调用和等待来自异步 API 结果,作为 Swift 并发语言功能一部分...三十四、Logging 来自 Swift os_signpost(_:dso:log:name:signpostID:) 是所有平台上框架操作系统一部分 三十五、Networking URLSession...三十六、隐私 要下载在应用隐私报告中显示应用内容文件,可以选择设置 > 隐私 > 记录应用活动。 三十七、Safari 底部标签栏经过重新设计,显示在页面内容下方。还可以选择在顶部显示地址栏。...四十、UIKit 对于针对 iOS 15 beta SDK 编译应用程序,在文本视图和文本字段中键入时,按键命令不再拦截文本输入和文本编辑命令。

8.6K40

使用Wolfram语言在你iOS设备上部署神经网络——识别毒蘑菇

,用于iOS应用程序),最后将其部署到您iPhone或iPad。...我们可以用一张来自 iNaturalist 用户观察照片来测试分类器: 保存我们训练好模型是一个很好做法,这样如果我们重新启动会话,我们就不需要重新训练网络了: 通过ONNX导出神经网络 作为一个中间步骤...coremltools允许我们使用一个文本文件来指定模型标签,该文件在新一行中包含每个类标签。...–2级: 将神经网络部署到IOS上 最后,我们只需要将我们 Core ML 模型集成到一个iOS应用程序中,并将其安装在我们iPhone上。...(注意,知道Swift编程语言不是必要)。 首先,我们需要下载苹果公司提供Xcode项目,用Vision和Core ML对图像进行分类,作为一个教程。

83430

零基础学习Swift数据科学

还有其他有趣库,比如swift ,coreml,transformer,可以让我们在iPhone上运行最先进文本生成模型,比如GPT-2、BERT等。 ?...但最重要是,为了使用苹果生态系统,你需要有一台苹果机器,你只能为苹果设备开发,如iOS, macOS等。 既然你已经有了Swift作为数据科学语言概述,让我们进入代码吧!...在你代码里包含注释文本,作为对自己注释或提醒。注释在编译时会被Swift忽略。 单行注释以两个斜杠(//)开头: // 我是注释....这意味着来自苹果公司Swift团队和谷歌Tensorflow团队工程师将确保你能够在Swift中进行高性能机器学习。...以下是我们训练步骤: 我们迭代每个epoch。epoch是遍历整个数据次数。 在epoch中,我们遍历训练数据集中每个样本,获取其特征(x)和标签(y),这对于下一步非常重要。

1.4K20

Python令人难以置信增长

由于在漫画中描述“增长速度最快”挑战,我们比较平均差异情节增长与整体平均水平。...Python年增长率达到了27%,Python独自成为一个既庞大又迅速增长标签; 显示出类似增长第二大标签是R.我们看到,高收入国家内大多数其他大型标签流量保持稳定,对Android,iOS和PHP...您还可以看到,其他一些小型语言与Python(如R,Go和Rust)类似或快速增长,而Swift和Scala等许多标签也呈现出令人印象深刻增长。他们流量如何与Python相比?...R和Swift等语言发展确实令人印象深刻,TypeScript在更短时间内显示出迅速扩张。许多这样小型语言从几乎没有问题流量发展成为软件生态系统中显着存在。...我们来看一下编程语言PYPL 编程语言索引PYPL是通过分析在Google上搜索语言教程频率来创建。 语言教程越多,语言就越受欢迎。这是一个领先指标。原始数据来自Google趋势。

72290
领券