首页
学习
活动
专区
工具
TVP
发布

R语言交流中心

专栏作者
178
文章
579037
阅读量
111
订阅数
R语言之双细胞检测工具DoubletFinder
双细胞的定义是一个液滴或一个微孔中包含了2个或多个细胞 。根据Poisson分布,单个液滴包含超过一个细胞(doublets或multiplets)的频率随着上机细胞的浓度而改变。通常如果上样细胞浓度较高,doublets/multiplets的频率也会增加。因此,单细胞实验中的doublets事件限制了实验时的细胞通量。当前有两个工具是比较流行的,一个是基于python的scrublet。其原理是数据中出现doublet时,有两种情况。一种称之为内嵌双细胞,在这种情况下,doublet和真正存在的某种细胞类型有相似的基因表达,doublet会和这些细胞被聚类到一起,同时在分群结果中占某一个群的一小部分,不会对最终的分析结果产生严重的影响。另一种情况称之为新型双细胞,在这种情况下,doublet会构成一个和现有的细胞类型基因表达非常不同的群,而这个新的群会严重影响到后续的分析结果。但不管在什么情况下,都假定doublet只占样本数据中很小的一部分。
一粒沙
2022-11-21
5.7K0
Python深耕之minGPT的使用
GPT(Generative Pre-Training)是OpenAI在2018年发表的一篇论文《Improving Language Understanding by Generative Pre-Training》中提出的框架,本框架通过两个阶段进行任务的实现:第一个阶段是利用语言模型进行预训练(无监督形式),第二阶段通过 Fine-tuning 的模式解决下游任务(监督模式下)。第一个阶段中其实和 Embeddings from Language Models(ELMO)模型 是类似的,区别在于GPT用的特征提取器是Transformer,ELMO用的是RNN;;ELMO使用上下文对单词进行预测,而 GPT 则只采用 Context-before 这个单词的上文来进行预测。第二阶段的下游任务在文献原文中进行了描述如下图:
一粒沙
2022-11-21
2K0
R语言之基于多组学的肿瘤亚群聚类分析
基于多组学数据的肿瘤亚型分组一直是研究者关注的一个方向,今天给大家介绍一个基于多组学进行聚类的R包SNFtool。此工具主要是利用相似网络融合将一个网络的多个视图融合在一起,构建一个整体的状态矩阵。算法的输入可以是特征向量、成对距离或成对相似度。学习到的状态矩阵可以用于检索、聚类和分类。其中核心的算法是谱聚类算法,其主要是完成对图的分割,找到最好的分割方式,来将图分割开来。这些图在这里就是我们构建的距离矩阵。简而言之,谱聚类先降维(特征分解),然后在低维空间用其它聚类算法(如KMeans、模糊聚类)进行聚类。
一粒沙
2022-11-21
1.2K0
Python深耕之Pycharm实现远程服务器连接
Pycharm作为python的一个重要开发工具深得大家的喜爱,并且专业版本更是开发了替代xshell等的ssh远程连接插件。首先我们来看下如何获得免费使用专业版本的权限。JetBrains为学生老师用户开通了免费许可。链接如下:
一粒沙
2022-11-21
1.3K0
Python深耕之图像深度学习必备工具包
因为研究方向的变动将本号更名为《R语言交流中心与Python深耕之路》,从R语言扩展到Python编程。今天给大家介绍下一个完整的深度学习模型的构建所需要的必备python模块。
一粒沙
2022-11-21
5840
R语言中聚类过程 可视化
今天给大家介绍一款进行聚类分析结果可视化的工具clustree。K-mean聚类大家都了解,是可以对优化的K进行选择的算法,那不是最优的k具体情况是否我们也可以进行展示出来,供大家进行更细致的评估?今天这个工具就具有这样的功能,同时在单细胞亚群分析中更是用的风生水起。首先我们看下包的安装:
一粒沙
2022-11-21
5730
R语言中科研绘图神器ggpubr
在整理图像的时候会让人觉得苦恼的就是怎么让绘图风格统一、画风高级。今天就跟大家介绍一个画图的神器,据说可以直接赢得主编的好感。此包就是ggpubr,一个联合ggplot2包进行绘图工具包。首先看下包的安装:
一粒沙
2022-11-21
1.2K0
R语言中list的批量操作
这个包的神奇之处在于能批量处理问题,例如,可以读取多个文件,跑模型的时候,可以批量输入多个参数,并把结果合并起来做比较
一粒沙
2022-06-07
1.8K0
R语言中基于表达数据的时间序列分析
聚类分析大家应该不陌生,今天给大家介绍一个用于基于时间序列的转录组数据的聚类分析R包Mfuzz。此包的核心算法是基于模糊c均值聚类(Fuzzy C-Means Clustering,FCM)的软聚类方法,它的特色就是把聚类的特征进行归类,而不是像K-mean一样的样本的聚类。此外FCM 算法需要两个参数⼀个是聚类数⽬C,另⼀个是参数m。⼀般来讲C要远远⼩于聚类样本的总个数,同时要保证C>1。对于m,它是控制算法的柔性的参数,如果m 过⼤,则聚类效果会很次,⽽如果m过⼩则算法会接近硬聚类(HCM)聚类算法。首先看下包的安装:
一粒沙
2022-06-07
1.1K0
R语言中的并行BioParallel
我们在前面曾经写过一个教程《R语言实现并行》,在其中我们测试了下几个基础的功能函数。今天给给大家带来另一个建立在基础包以上整合的并行R包BiocParallel。首先看下包的安装:
一粒沙
2022-06-07
1.5K0
R语言中的共定位分析
基于上面的假设,第四种设想 H4 在统计学上概率越高,越能解释显著信号位点如何影响表型。,H4值的范围在0-1之间,0表示概率为0%,1表示概率为100%。后验概率越高越好。很多文献认为PPA > 0.95的位点是共定位位点,也有一些文献会放松要求到0.75。接下来我们看下在R中如何进行实现这个分析方法。首先是包的安装:
一粒沙
2022-04-18
2.1K0
R语言中的绘图神器plotrix
大家在绘制科研图形的时候总会遇到各种想完美展示但是有各种受限的局面。最后都不得不去妥协,退而求其次。今天就来给大家介绍个神器,为各位去除后顾之忧。首先看下包的安装:
一粒沙
2022-03-14
1.9K0
R语言中多组学的因子分析
多组学的研究在不断进入各个疾病领域,那么如何整合这些多组学的特征成为多组学因子综合分析的挑战,今天给大家介绍一个可以类似于PCA分析对多维组学数据进行降维分析的工具包MOFA2。首先看下包的安装:
一粒沙
2022-03-14
9880
R语言中的突变signature分析工具
新的一年开始了,今天给大家介绍一款用于发现、预测和探索突变特征的综合分析工具包musicatk。此包主要基于COSMIC突变数据中的最新数据进行肿瘤突变模式的探索。我们首先看下包的安装:
一粒沙
2022-03-14
1.3K0
绘图布局patchwork
大家对ggplot2的绘图语法应该都很熟悉,但是如何多个图进行合理的拼接,一直是很头疼的事情,于是就有了patchwork包的诞生。此包主要的功能就是来对绘制的ggplot结果进行拼接展示。我们首先看下包的安装:
一粒沙
2022-03-14
7720
R语言中的keras
Keras是一个高层神经网络API,由纯Python编写而成。此API支持相同的代码无缝跑在CPU或GPU上;对用户友好,易于快速prototype深度学习模型;支持计算机视觉中的卷积网络、序列处理中的循环网络,也支持两种网络的任意组合;支持任意网络架构:多段输入或多段输出模型、层共享、模型共享等。这意味着Keras 本质上适合用于构建任意深度学习模型(从记忆网络到神经图灵机)兼容多种运行后端,例如TensorFlow、CNTK和Theano。
一粒沙
2021-12-20
2.3K1
R语言实现基因组的注释
批量获取一个基因或者SNP的详细信息在很多时候都是很困扰的一个问题,今天给大家介绍一个可以注释位点或者基因的R包cellabaseR。此包提供了getGene,getSnp,getProtein,getTranscript,getRegion,getVariant,getClinical,getTf,getXref信息获取功能。
一粒沙
2021-11-12
2.6K0
R语言实现VCF文件的处理可视化
基因突变数据大家应该很熟悉,作为突变信息的存储文件VCF文件,记录了突变的位点以及对应的突变信息。文件分为三个部分 ‘#’号开头行——meta, 非#号开头行分为fix和gt两个部分。fix部分存储vcf文件中非#号开头行的前7列,分别是染色体编号、碱基位置、ID、参考碱基、变异碱基、质量值、是否过滤;gt 部分存储两部分内容format、样本基因型。今天给大家介绍下在R语言中处理vcf文件的包vcfR。首先看下包的安装:
一粒沙
2021-10-21
3.7K1
R语言实现高级的韦恩图可视化
韦恩图大家应该都不陌生,主要用来展示不同事物或者组之间的数学或逻辑关系,主要用于集合的运算结果展示。今天给大家介绍一个在R语言中更加高级的展示形式,实现此功能的R包是UpSetR。首先看下包的安装:
一粒沙
2021-10-11
1.2K0
R语言中的流行病数据分析神器
大家在分析临床数据和流调数据的时候指定在为各种模型,表格构建煞费苦心。今天就给大家介绍一个解决这些问题的R包sjPlot。此包不仅可以实现三线表的绘制,同时可以进行模型结果的可视化展示、评估。首先我们看下包的安装:
一粒沙
2021-10-11
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档