首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    手把手 | 数据科学速成课:给Python新手的实操指南

    大数据文摘作品 编译:王梦泽、丁慧、笪洁琼、Aileen 数据科学团队在持续稳定的发展壮大,这也意味着经常会有新的数据科学家和实习生加入团队。我们聘用的每个数据科学家都具有不同的技能,但他们都具备较强的分析背景和在真正的业务案例中运用此背景的能力。例如,团队中大多数人都曾研究计量经济学,这为概率论及统计学提供了坚实的基础。 典型的数据科学家需要处理大量的数据,因此良好的编程技能是必不可少的。然而,我们的新数据科学家的背景往往是各不相同的。编程环境五花八门,因此新的数据科学家的编程语言背景涵盖了R, MatL

    05

    Nat Methods | OpenFold:对AlphaFold2重新训练提供了关于其学习机制和泛化能力的新见解

    今天为大家介绍的是来自Mohammed AlQuraishi团队的一篇论文。AlphaFold2凭借极高的蛋白质结构预测准确性,彻底改变了结构生物学。然而,其实现方式缺乏训练新模型所需的代码和数据。这些对于解决新任务(如蛋白质-配体复合物结构预测)、研究模型的学习过程以及评估模型在未见过的折叠空间区域的泛化能力都是必要的。在此,作者介绍了OpenFold,这是一种快速、高效且可训练的AlphaFold2实现。作者从零开始训练OpenFold,达到了与AlphaFold2相同的准确性。在此基础上,作者发现OpenFold在泛化能力上表现出色,即使训练集的规模和多样性被刻意限制,包括几乎完全排除某些二级结构元素类别的情况。通过分析训练过程中产生的中间结构,作者还获得了OpenFold在折叠学习过程中层次化方式的见解。总之,作者的研究展示了OpenFold的强大和实用性,并相信其将成为蛋白质建模领域的重要资源。

    02
    领券