专栏首页arxiv.org翻译专栏实现长期和可存档的可复制性(CS DL)
原创

实现长期和可存档的可复制性(CS DL)

可复制的工作流程解决方案通常使用创建时流行的高级技术,提供的是一种即时的解决方案,不可能长期持续。因此,我们引入了一套标准来解决这个问题,并证明其实用性和实施性。这些标准已经在一些研究出版物中进行了测试,可以总结为:完整性(除了与 POSIX 兼容的操作系统之外,没有任何依赖性,没有管理员权限,没有网络连接,主要以纯文本形式存储);模块化设计;最小的复杂性;可扩展性;可验证的输入和输出;时间出处;将分析与叙述联系起来;以及免费和开放源码软件。作为一个概念验证,我们已经实现了 "Maneage",一个以机器可操作和人类可阅读的纯文本存储项目的解决方案,实现了版本控制,廉价的归档,自动解析以提取数据出处,以及同行审查验证。我们证明了在不牺牲即时或短期可重复性的前提下,要求长期可重复的工作流解决方案是现实的,并讨论了该标准对科学进步的好处。本文本身已经用 Maneage 编写,快照 1637cce。

原文题目:Towards Long-term and Archivable Reproducibility

原文:Reproducible workflow solutions commonly use high-level technologies that were popular when they were created, providing an immediate solution which is unlikely to be sustainable in the long term. We therefore introduce a set of criteria to address this problem and demonstrate their practicality and implementation. The criteria have been tested in several research publications and can be summarized as: completeness (no dependency beyond a POSIX-compatible operating system, no administrator privileges, no network connection and storage primarily in plain text); modular design; minimal complexity; scalability; verifiable inputs and outputs; temporal provenance; linking analysis with narrative; and free-and-open-source software. As a proof of concept, we have implemented "Maneage", a solution which stores the project in machine-actionable and human-readable plain-text, enables version-control, cheap archiving, automatic parsing to extract data provenance, and peer-reviewable verification. We show that requiring longevity of a reproducible workflow solution is realistic, without sacrificing immediate or short-term reproducibility and discuss the benefits of the criteria for scientific progress. This paper has itself been written in Maneage, with snapshot 1637cce.

原文作者:Mohammad Akhlaghi, Raúl Infante-Sainz, Boudewijn F. Roukema, David Valls-Gabaud, Roberto Baena-Gallé

原文地址:https://arxiv.org/abs/2006.03018

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • x86汇编语言之8086语法和指令集

    上面使用db或者dw定义数据的方式,定义数据的同时就已经定义好了数据所在的物理地址, 如果我们想要从指定的内存地址中写入或者读取数据的话,需要借助段寄存器来实现...

    乱码三千
  • 万数库:高性能可重复数系统库的设计和实现(CS)

    随着嵌入式系统的激增需要智能行为,定制编号系统优化整个系统每瓦的性能成为成功商业产品的基本组件。我们介绍了通用数字库,这是一个高性能的数字系统库,包括任意整数、...

    zstt8054929
  • 利用上下文知识和影响图进行推理(CS LO)

    影响图(ID)是众所周知的形式主义,它扩展了贝叶斯网络以对不确定性下的决策情况进行建模。 尽管它们方便用作决策理论工具,但它们的知识表示能力在捕获其他关键概念(...

    小童
  • DES/3DES/AES加密

    数据加密算法DES 数据加密算法(Data EncryptionAlgorithm,DEA)的数据加密标准(Data Encryption Standard,D...

    py3study
  • DES/3DES/AES

    数据加密算法DES 数据加密算法(Data Encryption Algorithm,DEA)的数据加密标准(Data Encryption Standard,...

    py3study
  • 一份最新的、全面的NLP文本分类综述

    Paper:Deep Learning Based Text Classification: A Comprehensive Review(Computer S...

    NewBeeNLP
  • 综述 | 近年来深度学习的重要研究成果(附PDF)

    本文列举出了近年来深度学习的重要研究成果,从方法、架构,以及正则化、优化技术方面进行概述。

    数据派THU
  • 入门 | 献给新手的深度学习综述

    论文:Recent Advances in Deep Learning: An Overview

    朱晓霞
  • 入门 | 献给新手的深度学习综述

    论文:Recent Advances in Deep Learning: An Overview

    CDA数据分析师
  • 入门 | 献给新手的深度学习综述

    论文:Recent Advances in Deep Learning: An Overview

    机器之心
  • 这是一篇适合新手的深度学习综述

    论文:Recent Advances in Deep Learning: An Overview

    Datawhale
  • 【综述】一篇适合新手的深度学习综述

    来源:机器之心 作者:Matiur Rahman Minar、Jibon Naher

    yuquanle
  • 操作系统是如何分加载的

    开机的时候,寄存器cs:ip会强行指向FFFF0H这个地方,这是bios的地址。然后开始执行bios指令,bois指令会把启动盘第一个扇区的数据加载到0x07c...

    theanarkh
  • AI和IOT的结合:现在和未来

    为了更好地为目标客户服务,嵌入式设计团队今天正在研究新技术,如机器学习(ML)和深度学习(DL)。ML和DL使这些设计人员可以更快,更有限的资源开发和部署复杂的...

    刘盼
  • 写一个操作系统_05 调试MBR

    MBR的512字节里面也是代码,他被BIOS加载执行,自身执行的时候加载操作系统的loader,我们在没有操作系统loader的情况下先写一段测试程序,体验一下...

    changan
  • 算法工程师:双非渣硕是如何获得百度、京东双SP

    本人本科硕士皆双非,和牛客大佬们没得比,目前拿到的还可以的offer就是百度SP和京东SP,都是做的推荐算法,其他的不说了。 先说一下个人经历吧,学校比较水,实...

    牛客网
  • 标星7.2万热门开源项目youtube-dl遭下架,开发者的权益谁来保护?

    开源项目 youtube-dl 是一个使用 Python 编写的脚本,可以下载热门视频网站的音视频,并转换视频格式和清晰度。它是 GitHub 上的热门项目,获...

    AI算法与图像处理
  • 美军的AI发展计划研究(2)

    支持人工智能(AI)的技术有很多种,如机器学习(ML),这是计算机科学(CS)的成熟领域,根据统计和优化的深厚技术,可以建立数据的行为模式。在过去10年,ML某...

    数据猿
  • 深度学习在2017年的十大发展趋势及预测

    在本篇文章中,作者对深度学习在接下来一年中的发展趋势作出了十条预测。本文作者在《2011年软件开发趋势和相关预言》的十条预言中,有六条是准确的。 ? 在之前的博...

    AI科技大本营

扫码关注云+社区

领取腾讯云代金券