Galaxy Project(https://galaxyproject.org/)是在云计算背景下诞生的一个生物信息学可视化分析开源项目。
该项目由美国国家科学基金会(NSF)、美国国家人类基因组研究所(NHGRI)、哈克生命科学研究所(The Huck Institutes of the Life Sciences)、宾州州立大学网络科学研究所(The Institute for CyberScience at Penn State),以及约翰霍普金斯大学(Johns Hopkins University)提供支持,是目前生物医学研究领域最受欢迎的在线生物信息分析工具之一。
2021年3月左右,Galaxy Project 正式发布了 Release-21.01 的版本;3月17日,发布该版本的 announcement 文档。这里总结一下该版本一些主要的更新内容,为关注和从事 Galaxy 相关工作的中文用户提供参考。
工作流(Workflows)是 Galaxy v21.01 版本中的绝对明星,它们已经有了巨大的改进。
在这个版本中我们可以看到工作流程已经有了巨大的改进!工作流报告编辑器比以往任何时候都更容易使用,它为您提供了一个常用报告组件的列表、将它们嵌入到报告中的交互式接口,以及一个新的工作流调用跟踪器。现在,您可以将可视化直接嵌入到您的工作流报告中,从而使得您在总结您的分析时比以往任何时候都更容易。而且,一旦您的报告生成,您可以直接将它们导出到页面,以便与同事分享您的报告。
如果您正在利用 Galaxy 强大的子工作流构建高级工作流来实现可重用的工作流组件,那么您将很高兴地知道,您现在可以自动将这些工作流更新为最新版本。
此外,当您将工作流程与他人分享时,一个新的“最佳实践”检查器已经包含在内,它可以帮助您发现简单的事情,使您的工作流程更具有可共享性。
从21.01开始,顶级功能的突出显示一直存在激烈的竞争,但是远程文件界面绝对是一种非常棒的浏览数据的新方式。在 Galaxy 内部,有一种新的、抽象的方式来引用本地和其他服务器上的文件。这让我们提供一个统一的接口到 FTP 服务器,如您的 Dropbox,公共 S3 存储桶,等等!你可以在上传界面的选择远程文件下找到这个。
Galaxy Climate 社区正在提供一个很好的测试案例;他们的大部分数据都公开发布在公共的 S3 存储桶上,这些数据不容易获得,现在他们可以直接从 Galaxy 系统获得。不再需要在文档中再次执行"import this url"这个神奇的步骤,现在 "只需要浏览存储库中的数据"。
但是远程文件浏览器的增加并没有止步于此!其他几个接口接收到了使用这个新框架的更新:
历史记录现在可以直接导出到你的 FTP 文件夹,Dropbox,或任何其他配置的远程文件存储。
历史导入也进行了同样的处理,允许从任何这些公共数据位置导入,使它比以往任何时候都更容易在 Galaxy 系之间共享历史,并使您的分析更复制!
更多截图和更多功能请参见 Pull Request 11054。
同样,Rule-Builder 现在可以访问远程文件接口。在许多 FTP 服务器和其他位置都可以轻松地找到带有标识符的示例表,然后通过这个新接口直接加载到 Rule Builder 中。太简单了!
历史记录面板在最新代码中得到了更新和巨大的性能提升。这听起来让你兴奋吗?现在你就可以通过点击历史菜单选项的"Use Beta History Panel"。这不是它的最终状态,但是我们希望得到用户的反馈,告我们你是如何找到它的。这个新的历史面板它具有性能和可用性改进的特点。例如,现在你不需要单独的菜单就可以重命名文件,只需双击数据集标题即可!
这是一个新的部分,涵盖较小的改进,只是使您的工作更容易,加速您与 Galaxy 的互动。
NORA,一个医学图像查看器和注释工具(感谢 @bgruening,Pull Request 1103)
用于深度变焦图像的 OpenSeadragon 查看器(感谢 @gregvonkuster,Pull Request 10756)
[1]
完整的发行说明:January 2021 Galaxy Release (v 21.01)
[2]
21.01 announce user:January 2021 Galaxy Release (v 21.01)