首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

利用“分而治之”的对比学习方法来进行大规模细胞表征学习的研究

今天为大家介绍的是来自清华研究大学团队的一篇论文。单细胞RNA测序(scRNA-seq)数据是理解“生命之语”的强大工具,能为各种生物医学任务提供新见解。近来,大规模语言模型(LLMs)开始用于细胞表征学习。但现有基于BERT架构的细胞表征学习方法存在问题,它们产生的嵌入空间不均匀,导致语义表达效率不高。对比学习通过均匀分布嵌入来解决这个问题。然而,对比学习中更大的批量大小能带来更好的表征,但scRNA-seq数据的高维性和LLMs的大参数量限制了其实际应用。为解决这个问题,作者提出了一种新颖的“分而治之”对比学习方法,它能够解耦批量大小和GPU内存大小的关系,用于细胞表征学习。基于这种方法,作者介绍了单细胞语言模型(CellLM),这是一个大规模的细胞表征学习模型,能够处理包含成千上万基因的高维scRNA-seq数据。CellLM拥有超过5000万个参数,利用200万个scRNA-seq数据进行训练,它是首次尝试从正常细胞和癌细胞中学习细胞语言模型。CellLM在所有评估的下游任务中都达到了新的最先进水平。

01

深度学习相关概念:6.批量归一化

在训练过程中,每层输入的分布不断的变化,这使得下一层需要不断的去适应新的数据分布,这就会让训练变得非常复杂而且缓慢。为了解决这个问题,就需要设置更小的学习率、更严格的参数初始化。通过使用批量归一化(Batch Normalization, BN),在模型的训练过程中利用小批量的均值和方差调整神经网络中间的输出,从而使得各层之间的输出都符合均值、方差相同高斯分布,这样的话会使得数据更加稳定,无论隐藏层的参数如何变化,可以确定的是前一层网络输出数据的均值、方差是已知的、固定的,这样就解决了数据分布不断改变带来的训练缓慢、小学习率等问题。

02

Single-Shot Refinement Neural Network for Object Detection

对于目标检测,两阶段方法(如Faster R-CNN)的准确率最高,而单阶段方法(如SSD)的效率较高。为了在继承两种方法优点的同时克服它们的缺点,本文提出了一种新的单阶段检测器,称为RefineDet,它比两阶段方法具有更好的精度,并保持了与单阶段方法相当的效率。RefineDet由两个相互连接的模块组成,即锚点细化模块和目标检测模块。具体来说,前者的目的是(1)过滤掉负锚点,减少分类器的搜索空间,(2)粗调锚点的位置和大小,为后续回归器提供更好的初始化。后一个模块以改进后的锚为输入,进一步改进回归,预测多类标签。同时,我们设计了一个传输连接块来传输锚点细化模块中的特征,以预测目标检测模块中目标的位置、大小和类标签。多任务丢失功能使我们能够以端到端方式训练整个网络。在PASCAL VOC 2007、PASCAL VOC 2012和MS COCO上的大量实验表明,RefineDet能够以高效的方式实现最先进的检测精度。

01

神经网络速记概念解释

1、将输入图像传递到第一个卷积层中,卷积后以激活图形式输出。 图片在卷积层中过滤后的特征会被输出,并传递下去 2、每个过滤器都会给出不同的特征,以帮助进行正确的类预测。 因为需要保证图像大小的一致,所以使用同样的填充(零填充), 否则填充会被使用,因为它可以帮助减少特征的数量 零填充,可以理解为特征稀疏化,留下来的特征更能代表这个图像 3、随后加入池化层进一步减少参数的数量 4、在预测最终提出前,数据会经过多个卷积和池化层的处理。 卷积层会帮助提取特征,越深的卷积神经网络会提取越具体的特征, 越浅的网络提取越浅显的特征 5、CNN 中的输出层是全连接层,其中来自其他层的输入在这里被平化和发送, 以便将输出转换为网络所需的参数 6、随后输出层会产生输出,这些信息会互相比较排除错误。 损失函数是全连接输出层计算的均方根损失。随后我们会计算梯度错误 7、错误会进行反向传播,以不断改进过滤器(权重)和偏差值 8、一个训练周期由单次正向和反向传递完成

02

深度学习入门系列1:多层感知器概述

深度学习入门系列1:多层感知器概述 深度学习入门系列2:用TensorFlow构建你的第一个神经网络 深度学习入门系列3:深度学习模型的性能评价方法 深度学习入门系列4:用scikit-learn找到最好的模型 深度学习入门系列5项目实战:用深度学习识别鸢尾花种类 深度学习入门系列6项目实战:声纳回声识别 深度学习入门系列7项目实战:波士顿房屋价格回归 深度学习入门系列8:用序列化保存模型便于继续训练 深度学习入门系列9:用检查点保存训练期间最好的模型 深度学习入门系列10:从绘制记录中理解训练期间的模型行为 深度学习入门系列11:用Dropout正则减少过拟合 深度学习入门系列12:使用学习规划来提升性能 深度学习入门系列13:卷积神经网络概述 深度学习入门系列14:项目实战:基于CNN的手写数字识别 深度学习入门系列15:用图像增强改善模型性能 深度学习入门系列16:项目实战:图像中目标识别 深度学习入门系列17:项目实战:从电影评论预测情感 深度学习入门系列18:循环神经网络概述 深度学习入门系列19:基于窗口(window)的多层感知器解决时序问题 深度学习入门系列20:LSTM循环神经网络解决国际航空乘客预测问题 深度学习入门系列21:项目:用LSTM+CNN对电影评论分类 深度学习入门系列22:从猜字母游戏中理解有状态的LSTM递归神经网络 深度学习入门系列23:项目:用爱丽丝梦游仙境生成文本

02

Gradient Harmonized Single-stage Detector

虽然两级检测器取得了巨大的成功,但是单级检测器仍然是一种更加简洁和高效的方法,在训练过程中存在着两种众所周知的不协调,即正、负样本之间以及简单例子和困难例子之间在数量上的巨大差异。在这项工作中,我们首先指出,这两个不和谐的本质影响可以用梯度的形式来概括。此外,我们提出了一种新的梯度协调机制(GHM)来对冲不协调。GHM背后的原理可以很容易地嵌入到交叉熵(CE)等分类损失函数和smooth l1 (SL1)等回归损失函数中。为此,我们设计了两种新的损失函数GHM-C和GHM-R来平衡梯度流,分别用于anchor分类和bounding box细化。MS COCO的消融研究表明,无需费力的超参数调整,GHM-C和GHM-R都可以为单级探测器带来实质性的改进。在没有任何附加条件的情况下,该模型在COCO test-dev set上实现了41.6 mAP,比目前最先进的Focal Loss(FL) + SL1方法高出0.8。

01

cvpr目标检测_目标检测指标

Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep learning object detectors have avoided pyramid representations, in part because they are compute and memory intensive. In this paper , we exploit the inherent multi-scale, pyramidal hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost. A topdown architecture with lateral connections is developed for building high-level semantic feature maps at all scales. This architecture, called a Feature Pyramid Network (FPN), shows significant improvement as a generic feature extractor in several applications. Using FPN in a basic Faster R-CNN system, our method achieves state-of-the-art singlemodel results on the COCO detection benchmark without bells and whistles, surpassing all existing single-model entries including those from the COCO 2016 challenge winners. In addition, our method can run at 6 FPS on a GPU and thus is a practical and accurate solution to multi-scale object detection. Code will be made publicly available.

04

懂点深度学习:【白话】模型

问题导读 1.什么是机器学习模型? 2.机器学习数学符号是如何认识的? 3.损失函数的作用是什么? 我们可能听说过机器学习、深度学习。可是我们可能觉得非常神秘或则难懂。有这种感觉,是因为对人工智能缺乏了解造成的。深度学习和我们的传统编程其实是差不多的,关键是我们要懂里面的逻辑,或则说知识,或则说门道,懂了这些,我们机器学习就会比较简单了。这里给大家说说,我们经常听到的“模型”,什么是机器学习模型,模型训练,怎么个训练法。 提前说明的是,这里我们举例,举例的时候大家可能看到一些特殊的符号就懵逼了,其实这都是我们的错觉造成的,比如2的N次方,我们知道它是2*2*2.。N,这是它表示的含义。可能当我们看到

02
领券