一
论文题目:
CollaGAN: Collaborative GAN for Missing Image Data Imputation 论文摘要:
在需要多个输入以获得所需输出的应用程序中,如果缺少任何输入数据,通常会引入大量的偏差。虽然已经发展了许多计算缺失数据的技术,但由于自然图像的复杂性,图像计算仍然很困难。为了解决这一问题,我们提出了一种新的缺失图像数据计算框架,称为协作生成对抗网络(CollaGAN)。CollaGAN将图像计算问题转换为多域图像到图像的转换任务,使单个生成器和判别器网络可以利用剩余的干净数据集成功地估计缺失的数据。我们证明,在各种图像计算任务中,CollaGAN比现有的竞争方法具有更高的视觉质量。
论文链接:
https://openaccess.thecvf.com/content_CVPR_2019/papers/Lee_CollaGAN_Collaborative_GAN_for_Missing_Image_Data_Imputation_CVPR_2019_paper.pdf
二
论文题目:
Collaborative Sampling in Generative Adversarial Networks 论文摘要:
生成对抗网络(GANs)的标准做法在采样过程中没有使用判别器。然而,这种抽样方法丢失了由判别器学习到的关于数据分布的有价值的信息。在这项工作中,我们提出了一个协作采样方案,由生成器和判别器改进的数据生成。在判别器的指导下,我们的方法通过在生成器的特定层上进行基于梯度的更新来细化生成的样本,使生成器的分布更接近真实的数据的分布。此外,我们提出了一种实用的判别器方法,它可以通过基于平滑的鉴别器提供的损失值,以实现有效的样本细化。通过在合成数据集和图像数据集上的广泛实验,我们证明了我们提出的方法可以在定量和定性上改进生成的样本,为GAN采样提供了一个新的理念。
论文链接:
https://arxiv.org/pdf/1902.00813.pdf
三
论文题目:
Self-Supervised Pre-Training for Protein Embeddings Using Tertiary Structures 论文摘要:
蛋白质的三级结构在很大程度上决定了它与其他分子的相互作用。尽管在各种与结构相关的任务中非常重要,但完全监督的数据获取起来往往既耗时又昂贵。现有的预训练模型大多侧重于氨基酸序列或多序列比对,而结构信息尚未被充分利用。本文提出了一种用于从蛋白质三级结构中学习结构嵌入的自监督预训练模型。天然蛋白质结构受到随机噪声的干扰,预训练模型的目的是估计扰动3D结构上的梯度。具体地说,作者采用SE(3)不变特征作为模型输入,在保留SE(3)等方差的情况下重建三维坐标上的梯度。这种模式避免了使用复杂的SE(3)等变模型,极大地提高了预训练模型的计算效率。作者在两个下游任务:蛋白质结构质量评估(QA)和蛋白质-蛋白质相互作用(PPI)位点预测上展示了该预训练模型的有效性。提取层次结构嵌入以增强相应的预测模型。大量实验表明,这种结构嵌入一致地提高了两个下游任务的预测精度。
论文链接:
https://www.aaai.org/AAAI22Papers/AAAI-2784.GuoY.pdf
四
论文题目:
Contact-Distil: Boosting Low Homologous Protein Contact Map Prediction by Self-Supervised Distillation 论文摘要:
准确的蛋白质接触图预测(PCMP)对于精确的蛋白质结构估计和进一步的生物学研究是至关重要的。最近的工作通过高质量的多序列比对(MSA)在这项任务上取得了显著的性能。然而,当只有较差的MSA(例如,绝对MSA计数小于10)可用时,PCMP准确性显著下降。因此,在本文中,作者提出了一种基于自监督模型的方法,Contact-Distil,通过对知识的蒸馏来提高相应的PCMP准确率。特别地,利用两个预先训练好的Transformers分别为教师和学生模型并行学习高质量和低质量的MSA表示。此外,通过预先训练的ESM-1b模型进一步从纯序列中提取协同进化信息,为提高学生的学习成绩提供辅助知识。大量实验表明,对于同源性较低的PCMP,Contact-Distil在CAMEO-L数据集上的性能远远优于以前的最新技术,即当MSA计数小于10时,分别比Alphafold2和MSA Transformer提高约13.3%和9.5%。
论文链接:
https://www.aaai.org/AAAI22Papers/AAAI-5215.WangQ.pdf