在世界各地,超级计算中心已经迅速发展起来,并为COVID-19的研究打开了大门,这可能是历史上最统一的超级计算成果。现在,来自欧洲JEDI的一项新竞赛准备将门槛提高到更高,目标是招募多达100个团队来粉碎数十亿个分子,以寻找一种covid19治疗药物,并提供数百万欧元的奖金。在接受HPCwire的采访时,JEDI的创始人安德烈·勒塞克鲁-皮埃特利(Andre Loesekrug-Pietri)谈到了这一雄心勃勃的、以超级计算机为动力的挑战的结构和目标。
JEDI,一个旨在成为“欧洲DARPA”和“登月工厂”的基金会,通常着眼于未来,专注于较长期的项目,这些项目需要数年时间,而且还没有获得与其社会影响相称的资金或科学关注。但随着COVID-19的问世,JEDI发现自己在当下的工作非常独特——并在一个拥挤的研究领域寻找创造附加值的方法。
“几周前,我们召集了所有涉及医疗保健行业的人士,试图理解:好吧,在这场全球危机中,我们还能有什么附加价值?””Loesekrug-Pietri说。专家们指出,研究过于关注单个分子,比如羟基氯喹,JEDI看到了一个突破口。
“为什么我们不利用高性能计算今天提供给我们的能力呢?”除此之外,我们为什么不让来自ML和人工智能的人员来优化这些计算呢?”Loesekrug-Pietri说。“因此,我们提出了一个挑战:我们能否筛查到前所未有的水平……对冠状病毒进行破坏或改善的相互作用?”
十亿个分子对抗COVID-19大挑战
这是一个引人注目的标题:十亿分子。然而,这个名字实际上可能低估了竞争对手的雄心。Loesekrug-Pietri解释说:“每个团队都需要拿出10亿个分子。”在挑战的第一阶段,每个团队(Loesekrug-Pietri预计大约50到100个团队将有能力竞争)将被要求用三种不同的筛选方法筛选这10亿个分子与covid19的亲和力。目的:识别具有强结合电位(100纳摩尔以内)的分子,使其进入挑战的第二阶段。
Loesekrug-Pietri说:“这里的独特之处,也受到气候模型的启发,不仅仅是让每个人都拿出自己的解决方案,而是要求所有的团队拿出三种不同的方法来筛选这些分子的结合亲和力。”在比赛的第一阶段和第二阶段之间,JEDI将利用许多团队使用多种方法所产生的混合结果,将所有团队的结果交叉关联起来,形成一个所谓的“最终名单”。Loesekrug-Pietri说:“通过交叉关联这些方法,你基本上可以排除偏见或错误。”他解释说,大多数研究人员不会在内部交叉关联他们的研究结果,更不用提那些使用完全不同方法的国际团队了。
Loesekrug-Pietri说,第二阶段是减少病毒载量,目标是减少99%。他说:“我们将再次要求研究小组提出非常有创意的病毒学计算方法,使用预测算法来确定他们想要测试的化合物的病毒排放量。”“然后我们将合成这些最终化合物,进行第二阶段的真正测试。因为否则的话,你只能停留在理论层面,这是很重要的一步,但之后你需要在真实的分子上进行测试。“最终名单中最有希望的候选分子将被合成——如果可能的话——它们降低病毒载量的潜力将在现实世界中得到测试。”Loesekrug-Pietri说:“如果你有亲和力加上病毒释放,那么你就会做一些非常强大的事情。”
第三个也是最后一个阶段将集中于测试现有的现实世界疗法。Loesekrug-Pietri说:“第三阶段基本上是一个阶段和两个阶段同时进行,再加上对现有的fda批准的药物使用这两个阶段。”他解释说,绝地武士想要瞄准研究人员可能忽略的所有药物。他说:“在这里,我们基本上是想创造意外发现,迫使人们也检查所有我们已经知道毒性的分子,基本上我们可以直接进行动物实验。”在得到科学界的反馈后,第三阶段还将加入药物鸡尾酒。“看看艾滋病毒是如何传播的,”Loesekrug-Pietri说。“我们花了25年的时间来测试单个药物,而今天,有效的东西是多达10种不同药物的混合物,需要在不同的阶段服用。”
超级计算机的火力
为了让这些团队进行他们的研究,JEDI将一个广受关注的超级计算机和科学组织的广泛联盟聚集在一起。高性能计算资源由法国国家高性能计算组织GENCI提供;欧洲先进计算伙伴关系(PRACE);德国电信(Loesekrug-Pietri表示,该公司正在投入所有的CPU和GPU资源)等。
JEDI也在努力将资源平均分配给参与者。,“我们目前建筑Loesekrug-Pietri解释说,“基本上是一个接口,直接参与者可以利用这些资源和请求一定数量的小时,数以百万计的核心小时,可能,它将销售做负载均衡,如果我可以称呼它。”
然而,Loesekrug-Pietri甚至不确定负载平衡是否有必要。他说:“我们自己可能有足够的资源,但这很难估计——这将真正取决于人们将使用的方法。”他补充说,与蛮力计算相比,机器学习方法有时可以提供30倍的速度提升,使总需求估计复杂化。在能力方面,Loesekrug-Pietri说JEDI的目标“不是无限的,而是接近的”。他说:“我们的核心工作时间只有数千万个,如果不是数亿个的话。”
众包计算巨头Folding@home正在与绝地武士密切合作,帮助为研究人员提供攻击候选分子的目标。Loesekrug-Pietri说:“我们有越多的目标,我们的团队就能在这些目标上运行他们数十亿个化合物,钥匙和锁的组合就越多。”你可以想象这些变成了绝对巨大的数字。Folding@home的约翰·乔德拉(John Chodera)已经加入了该挑战的科学委员会,该委员会还包括来自广泛的大学、研究机构和超级计算中心的领导人。
展望未来
这项挑战将于5月1日开始。Loesekrug-Pietri估计,前两个阶段将分别花费大约四周的时间,其间有几周的时间可以相互关联。然而,第三阶段可能与其他阶段共存,这取决于团队如何在挑战中前进。不管怎样,Loesekrug-Pietri说:“我们希望在6月底之前看到结果。他补充说,这项挑战是建立在开放科学的基础上的,参与者将把他们的研究结果存入公共图书馆,以帮助全球抗击COVID-19的努力。
Loesekrug-Pietri表示:“我们认为,在这个漫长的传统测试阶段,我们可以……更快地完成测试,而不必走捷径。”“通过交叉关联,通过使用这种大规模筛选,我们实际上能够自动化很多步骤,这些步骤正是今天这些临床试验如此漫长的原因——因为它们都是非常顺序的。我们正在尝试同时做很多事情。”
当然,对于JEDI来说,他们的目标是实现一颗“银河19号”月球探测器。Loesekrug-Pietri说:“我们已经对这将是一个巨大的突破抱有很高的期望。”