首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ProGen:蛋白质生成语言模型

今天给大家介绍的是一项由硅谷Salesforce Research的Ali Madani等人和斯坦福的Possu Huang教授课题组合作的工作,他们在这篇论文中提出的一种蛋白生成语言模型ProGen。作者将蛋白质工程视为无监督序列生成问题,利用大约2.8亿个的蛋白质序列对12亿个参数进行训练,且要求这些蛋白质序列是基于分类和关键字标签的,如分子功能和细胞成分,这为ProGen模型提供了前所未有的进化序列多样性,并允许它进行基于一级序列相似性、二级结构准确率和构像能量的细粒度控制生成。根据NLP指标,ProGen模型表现出良好的性能,且随着氨基酸上下文和条件标签的增多,模型效果会进一步提升。ProGen也适用于未见的蛋白家族,若进行微调,模型效果更好。

06

Sci. Adv. | 基于非线性机械展开响应的端到端新蛋白生成使用语言扩散模型

今天为大家介绍的是来自Markus J. Buehler团队的一篇论文。自然进化过程中,大自然展现了一系列具有卓越机械性能的蛋白质材料,这些蛋白质在机械生物学中扮演着至关重要的角色。然而,超越自然设计,发现满足特定机械性质要求的蛋白质仍然是一个挑战。在这里,作者报道了一种生成模型,该模型能够预测出为满足复杂的非线性机械性质设计目标的蛋白质设计。作者的模型利用了来自预训练蛋白质语言模型的深层蛋白质序列知识,并将机械展开响应映射出来以创建蛋白质。通过分子模拟进行直接验证,作者展示了所设计的蛋白质是全新的,并且满足了目标机械性质,包括展开能量和机械强度。

01

SinGAN: Learning a Generative Model from a Single Natural Image

我们介绍了SinGAN,这是一个无条件的生成模型,可以从单一的自然图像中学习。我们的模型经过训练,可以捕捉到图像中斑块的内部分布,然后能够生成高质量的、多样化的样本,这些样本承载着与图像相同的视觉内容。SinGAN包含一个完全卷积GAN的金字塔,每个负责学习图像不同比例的斑块分布。这允许生成任意大小和长宽比的新样本,这些样本具有显著的可变性,但同时保持训练图像的全局结构和精细纹理。与以前的单一图像GAN方案相比,我们的方法不限于纹理图像,也不是有条件的(即它从噪声中生成样本)。用户研究证实,生成的样本通常被混淆为真实的图像。我们说明了SinGAN在广泛的图像处理任务中的效用。

05

2024年YOLO还可以继续卷 | MedYOLO是怎么从YOLO家族中一步一步走过来的?

在3D医学影像中进行物体定位的标准方法是使用分割模型对感兴趣的目标进行 Voxel 到 Voxel 的标注。虽然这种方法使模型具有很高的准确性,但也存在一些缺点。为医学影像生成 Voxel 级准确的标注是一个耗时的过程,通常需要多个专家来验证标签的质量。由于标注者之间的变异性,器官或病变的医学术准确的分割可能会出现结构边界不确定的问题,这可能会导致附近组织中包含无关信息或排除相关信息。即使有高质量的标签,分割模型在准确标记目标结构边界时可能会遇到困难,通常需要后处理来填充缺失的内部体积并消除伪预测目标。总之,这使得分割模型的训练成本过高,同时可能会限制下游诊断或分类模型的预测能力。

01
领券