首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

怀疑了不该怀疑的人

1.基因长度 之前写过:基因长度并不是end-start,有4种计算方式,其中非冗余外显子长度之和是更推荐。 2.非冗余外显子长度之和计算方法 找到了两种方法,曾老板代码是我之前一直在用。...file.exists(f)){ gle = lapply(split(exon,exon$gene_id),function(x){ tmp=apply(x,1,function(y){...那么问题来了,谁做对呢? 错那个,怎么就万分之一基因错了呢? 3.对答案 TCGA提供了tpm,这个很权威,不太可能会出错。...属于R语言高级玩家快乐 必须要研究一下曾老板高难度R语言代码,看看是个什么原理,为什么碰上这种问题数据会算出错误结果。...,:生成而向量长度相同,导致结果不是列表了,是个只有两列,且两列完全一致矩阵啊!

41110

关于如何用二代测序数据注释单细胞细胞群

下面的代码可以保存到脚本里面,使用nohup sh fastp.sh >fastp.log &挂载到后台运行,后同(其中在length这个参数,我以往一般是设置36,但是我发现CCL数据库和GEO数据库...read长度分别是102和52,所以根据正规流程,我们其实应该根据质控结果和经验分别设置他length长度,对两个数据库fastq数据分别过滤。...我猜测可能是上游数据,我和曾老师在数据处理参数设置问题,但我没有曾老师原始代码,现在也无从考证。 img 左边是曾老师,右边是我 那现在属于复现成功了吗??...我突然想到,既然我们根本目的只是为了将其分群,那我们只需要cluster_x群细胞在某个种类细胞系相关性结果即可。即当我们去计算总体相关性时,cluster之间时会相互影响。...;;可见数据总体表达还是没有问题,可能就是上游一些参数处理问题 img 与作者和曾老师结果相同 复现作者图(具体代码就不贴了,具体可见曾老师写推文《如果你觉得相关性热图不好看,或者太简陋》

57070
您找到你想要的搜索结果了吗?
是的
没有找到

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)

#plyr包里`join`函数会根据名称相同列进行匹配关联,`join`默认设置下执行左连接 reviewdf <- join(表1,表2) reviewdf <- 表1[!...x,]去掉了,没有label文本。...向量长度依存于A,会生成一个与A相同长度布尔向量,通过A[布尔向量,]就可以直接使用。 回忆一下,缺失值查找函数,A[na.is(x)],也是生成布尔向量。 详细见2.3停用词删除用法。...lapply(x, length) #每一个元素长度,即文本分出多少个词 temp <- unlist(temp) #lapply返回是一个list,所以3行unlist id <- rep(test...<- unlist(x) #6行将list解散为向量 testterm <- as.data.frame(cbind(id, term, label), stringsAsFactors = F) #

3.6K20

R语言数据清洗实战——复杂数据结构与list解析

这是为什么呢,还记得我们预览第一条记录时候是长度是53,可是这么展开列表时候结果却是75,很诡异吧,我猜是这144个课程属性信息长度不等,有些课程是53个属性,有些会更多。...2 64 10 3 75 1 果然,144个记录,只有133个是53条属性信息,10个是64条信息,还有1个是75条信息,我们展开列表是75列,说明函数按照子列表中长度最大列进行展开与合并...(.data, expr) 只有两个参数,第一个是数据框,第二个是匿名函数。...(就跟pythonlambda差不多一个意思,没有函数名无头函数)。...list内元素路径(就像是提取数据框列一样,只不过是多层而已),实现矢量化提取和递归操作,将每一个子对象相同元素一次全部提取出来。

1.5K50

R语言中 apply 函数详解

这里, X是指我们将对其应用操作数据集(在本例是矩阵) MARGIN参数允许我们指定是按行还是按列应用操作 行边距=1 列边距=2 FUN指的是我们想要在X上“应用”任何用户定义或内置函数 让我们看看计算每行平均数简单示例...'每个值,将x2,x3作为其他参数,这些参数将首先声明,然后通过apply函数传递: b = 2 c = 1 # apply along each row: row_fn <- apply(data...我创建了一个简单表,告诉我们返回类型: 返回值 每个元素长度 输出 列表 1个 向量 列表 > 1并且长度相同 矩阵 列表 > 1,且长度可变 列表 我们将看到上述所有场景示例: 场景1...场景2:每个元素长度>1且相同 data <- list(l1 = c(1, 2, 3, 4), l2 = c(5, 6, 7, 8), l3 =...让我们首先从最初定义矩阵创建一个数据帧: df <- as.data.frame(data) ?

20K40

深度 | 在R估计GARCH参数存在问题(续)

本期作者:徐瑞龙 未经授权,严禁转载 本文承接《在 R 估计 GARCH 参数存在问题》 在之前博客《在 R 估计 GARCH 参数存在问题》,Curtis Miller 讨论了 fGarch...本文承接之前博客,继续讨论估计参数稳定性,这次使用是前文中提到,但没有详尽测试 rugarch 包。...rugarch 包使用 rugarch 包负责估计 GARCH 模型参数最主要函数是 ugarchfit,不过在调用该函数值前要用函数 ugarchspec 创建一个特殊对象,用来固定 GARCH...之前猜测是对,样本要极端大才能保证估计质量。 其他参数行为。...,这一节论和之前文章结论大体一致,参数估计不稳定性集中体现在 β 身上。

1.9K30

高效备考方法-程序修改题

函数返回值及其参数:重点 int fun(int x,int y) { if(x>y)return x; else...从两个地方来看,首先return x;x类型必须和fun函数返回值相同x是整型。其次c=fun(a,b);fun函数将一个返回值赋值给了变量c,说明函数返回值一定是整型。...(2) 函数传递参数: int fun(int *x,int *y) { if(*x>*y)return *x; else return *y; } main()...如果存在*x=x+y;类似情况一定是错误必须要将赋值号左右两边类型变 为一致。 6. 数组 (1)数组下标的初始值:数组下标从零开始,到长度减1结束。...(2) 普通变量初始值: 依照上面的技巧,我们同样可以将它延伸到普通变量。 (3) 数组和字符串长度减1: 当使用数组元素时,最大值只能到数组长度减1。

1K10

PyTorch入门笔记-masked_select选择函数

输入张量形状要相同。」...参数输入张量形状可以不相等,但是这两个张量必须能够通过 PyTorch 广播机制广播成相同形状张量; 简单回顾广播机制:广播机制 (Broadcast) 是在科学运算中经常使用小技巧,它是一种轻量级张量复制手段...; 如果两个张量在所有维度上都是相容,表示这两个张量能够进行广播,否则会出错; 在任何一个维度上,如果一个张量长度为 1,另一个张量长度大于 1,那么在该维度上,就好像是对第一个张量进行了复制;...「对于 masked_select 函数广播机制比较简单,因为无论在什么情况下都是需要将传入 mask 参数布尔张量广播成与传入 input 参数输入张量相同形状。...1D 张量,张量元素就是被筛选出来元素值; 传入 input 参数输入张量和传入 mask 参数布尔张量形状可以不一致,但是布尔张量必须要能够通过广播机制扩展成和输入张量相同形状;

3.8K20

R 可视化 | 华夫饼图

代码看着很长,但是有一半都是主题设置theme(). ggplot(df, aes(x = y, y = x, fill = category)) + geom_tile(color = "white...=1 表示 x , y 轴长度相同 scale_x_continuous(trans = 'reverse') +#expand = c(0, 0), scale_y_continuous(trans...当只有一个变量/类别时(所有点都是相同颜色),点 状华夫饼图相当于比例面积图 library(ggforce) ggplot(df, aes(x0 = y, y0 = x, fill = category...从纵坐标(x)看,在 x 为 10 时,全是 suv 类型。从总体来看,suv 占最多数(16 个),2seater 占最少数(2 个)。 堆积型华夫饼图 这里还有一种比较有趣华夫饼图。...reverse = FALSE, equal = TRUE, pad = 0, use_glyph = FALSE, glyph_size = 12, legend_pos = "right") 主要参数含义

1.1K10

Jelys Note之生信入门class6

数字来分配,同种类同个颜色】【映射—与数据有关是aes,根据数据某一列内容分配颜色【自动分配颜色,修改颜色】】图片比较:映射与手动设置【手动---与数据内容无关,与第几个点有关系,易出错】ggplot...参数,是具体颜色图片【代码差别:color=“blue”/colnames【字符串是geom_point参数是具体颜色/是列名与aes参数与数据有关】4....当aesx与y相同可都放在ggplot】ggplot(data = iris,mapping = aes(x = Sepal.Length, y = Petal.Length))----【全局】+geom_smooth...()+  geom_point()相同部分可以放在全局ggplot函数,不相同部分可以放在各自局部函数没有不一致地方,可空着【局部与全局区别,局部设置只对当前图层有效;全局设置,对所有图层有效...y,不统计,数据直接做图】fre = as.data.frame(table(diamonds$cut))ggplot(data = fre) +  geom_bar(mapping = aes(x =

65200

R语言_基本统计分析

#独立样本t检验 #假设:两个总体均值相等,并且从正态总体取得 #下面进行假设方差不等双侧检验,比较南方和非南方监禁概率 #可以拒绝相同监禁概率假设,因为p<0.01 library(MASS...U2,paired=TRUE)) #多于两组情况 #假设数据从正态总体独立抽样而得 ANOVA分析 #组件差异参数检验 #如果数据无法满足t检验或者anova参数假设,一般采用非参数方法...来评估观测是否是从相同概率分布 #即:在一个总体获得更高得分概率是否比另一个总体更大 #评价:是非独立样本t检验一种非参数替代方法。适用于两组成对数据和无法保证正态性假设情景。...#1 with(UScrime,by(Prob,So,median)) wilcox.test(Prob~So,data=UScrime) #2 #在本例,含参t检验和其作用相同参数检验得到了相同结论...TRUE)) #非参数多于两组比较 class = state.region var = state.x77[,c("Illiteracy")] mydata = as.data.frame(cbind

1.1K20

R包“ieugwasr“教程---SNP信息查询

在孟德尔随机化研究,我们常常会碰到SNP没有rsid情况,这个时候需要我们把rsid添加上,如果SNP个数不是很多的话,我们可以使用variants_chrpos()函数: library(ieugwasr...) 函数variants_chrpos()只有两个参数chrpos和radius,其中参数chrpos就是用染色体和碱基位置标记信息,其格式为“chr:pos(染色体号:碱基位置)“,而参数radius...下面的第一幅图是radius为0结果,也即as.data.frame(SNPinfo1) 输出结果,第二幅图是radius为100结果,也即as.data.frame(SNPinfo2)输出结果...GENEinfo), 25) 同函数variants_chrpos()一样,函数variants_gene()也只有两个参数,其中参数radius在两个函数是一致,variants_gene()参数...,SNP列列名必须为“rsid“,而暴露P值列名必须为”pval“。

4.8K60

R语言数据结构(包含向量和向量化详细解释)

也就是说,向量所有元素必须属于同种模式(mode),或数据类型(见1.2),比如数值型,字符型等。其类型可以用typeof()查看。 标量只含有一个元素,在R没有0维度或标量类型。...[1]表示这行得第一项是输出结果第一项。 x由3个元素组成,分别是3,23,5 长度就是其包含元素个数。注意区别后面的列表长度。...还有合并 apply族函数在数据框用法 apply lapply sapply apply 如果数据框每一列数据类型相同,则可以对该数据框使用apply函数。或针对数据框某些列应用。...因子常用函数tapply split by tapply tapply(x,f,g)其中,x是向量,f是因子(比如性别,党派),g是函数 要求f每个因子需要与x有想通长度。...但是,tapply第一个参数必须是向量,不能是矩阵或数据框,而回归分析必须至少两列数据或数据框,其中第一列是被预测变量,第二列或多列是预测变量。所以tapply函数不能满足任务。

7K20

109-R可视化33-通过seurat包LabelClusters学习ggplot之二

参考: Seurat::LabelClusters 前言 继续上回内容[[108-R可视化32-通过seurat包LabelClusters学习ggplot之一]]。...,这里语法限制了传入group 列必须得是factor 类型(强制转型成字符串进行判断);以及数据框需要是dataframe 类型(x[,'y']取子集操作对于table 类型数据框并不会转型成向量...is.null(x = split.by)) 那我们就先看看else 处理: as.data.frame(x = t(x = apply(X = data.use[, xynames,...labels 长度是否等长; 将外部等长labels 名称和labels 内部id 替换; 绘图函数 在ggplot 家族,我们介绍过两种label 方式:[[66-R可视化10-自由在ggplot...} return(plot) 对了,还记得上次[[108-R可视化32-通过seurat包LabelClusters学习ggplot之一]] 最后问color用途吗?

97610

java学习笔记(基础篇)—java数组

数组是用来保存一组数据类型相同元素有序集合,数组每个数据称为元素。有序集合可以按照顺序或者下标取数组元素。 在Java,数组也是Java对象。...数组元素可以是任意类型(包括基本类型和引用类),但同一个数组里只能存放类型相同元素。 二:什么时候用数组? 保存一堆数据类型相同数据时候。 数据要求有顺序。...数组每个数据为元素; 2) 数组是一个对象,成员是数组长度和数组元素; 3) 申明了一个数组变量并不是创建了一个对象; 4) 申明数组方式;...非法数组初始化方式: int[] x = new int[5]{5,4,3,2,1};//编译出错,不能在[]中指定数组长度; int[] x; x = {...2)一个方法只能定义一个可变长参数,并且要定义最后一个参数

61630

如何批量给自己文件重命名

而且,中间还不能出错喔,万一年份搞错了,那 排查起来,可又是想跳楼心都有。 那么,有没有更好方法? 听过Jimmy老师都知道啦,解决问题能力,就是编程能力。...这种活,必须是代码批量处 理啊。。 OK,自己想要最终命名格式为:把每个文件之前加上年份区间,而且保证每个文件对应年份准确无 误,这样子: ?...把文件下载网站注释文件复制下载下来,其长这样: ?...XPT后缀文件全部读取进来 xpt <- as.data.frame(list.files('.','.XPT')) colnames(xpt) <- 'names' 处理后tmp文件就长这样了: ?...(偷偷告诉你哟,file.rename函数来自 于base包哟,xpt文件为SAS数据文件,可以通过R,foreign包一键读取哟)

1.7K20

RNA-seq入门实战(三):在R里面整理表达量counts矩阵

他前面的分享是: Counts FPKM RPKM TPM CPM 转化 获取基因有效长度N种方 下面是他对我们b站转录组视频课程详细笔记 本节概览: 从featureCounts输出文件获取...table(duplicated(symbol)) #统计重复基因名 ###使用aggregate根据symbol列相同基因进行合并 counts <- aggregate(counts...column_to_rownames(counts,'Group.1') tpm <- aggregate(tpm, by=list(symbol), FUN=sum) ###使用aggregat 将symbol列相同基因进行合并...这里只展示了获取基因表达TPM值,如果还想了解如何获得FPKM值请参考文章:获取基因有效长度N种方法第二部分内容以及Counts FPKM RPKM TPM 转化。...(files,'\\/'), function(x) x[length(x)-1]); cn colnames(txi$counts) <- gsub('_quant','',cn); colnames

15K45
领券