首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言基因组数据分析可能会用到data.table函数整理

因此,在对大数据处理上,使用data.table无疑具有极高效率。这里主要介绍在基因组数据分析中可能会用到函数。...; blank.lines.skip 默认FALSE,如果TRUE,跳过空白行 key 设置key,用一个或多个列名,会传递给setkey showProgress TRUE会显示脚本进程...,当用file==""时,自动忽略此参数; verbose 是否交互和报告时间 dcast.data.table 和reshape2包dcast一样, 这个函数用来重铸表格,并且再在大数据处理上...显示没有联合成功行列 value.var 填充值列,默认会猜测 现在我需要取数据DTv1,v2两列相同情况作为汇总一类,对它们v4值取平均,转换如下,...,如下 pattern函数下面会讲,这里再讲一下是melt和dcast联合使用,先用melt融合,再用dcast重铸 如下面例子

3.3K10
您找到你想要的搜索结果了吗?
是的
没有找到

Q&A:在melt和dcast之间反复横跳

Q&A:在melt和dcast之间反复横跳 写在前面 各位水友大家好,自从上一次发布了改版推文说明之后,大喵和村长收到了很多水友问题,我们也对这些问题进行了回复,希望能对大家R语言学习有所帮助,在此先谢谢各位支持...(`姓名`) ][, dcast(.SD, `姓名` ~ variable, value.var = c("用药名称", "用法", "用量", "服药时间", "用药依从性"))] data...利用这个函数目的在于,在data.table中进行数据处理贯彻是向量思维。 这也是R语言和Python语言进行数据处理底层逻辑。从数据特点角度来解释,也即是长表优于宽表。...最后一部分代码则为melt逆操作: data <- data[, dcast(.SD, `姓名` ~ variable, value.var = c("用药名称", "用法", "用量", "服药时间...,~左边变量为表更改结构以后体现记录识别唯一性primary key,~右边变量为数据变宽之后同类记录序号variable,value.var变量名与~右边变量中记录序号整合在一起生成一系列同类变量

64520

R语言︱情感分析—基于监督算法R语言实现(二)

(3)基于算法分析方式一般具有行业特殊性,也就是说很难训练一个可以跨行业模型,这样就会遇到另外一个问题:挑选训练样本。...书中提到,要统计tf,可以通过`table`函数、`dcast`函数(reshape2包、plyr包都有这个函数)等实现,但是尝试之后发现它们要不速度慢,要不就是占用内存太高,包括data.table...其中,data.table`dcast`函数比reshape2包里`dcast`好用,尽管他们参数都一样,但是很多人还是比较喜欢老朋友reshape2包,然而这一步需要大量内存,本书在服务器上完成...,如果你电脑报告内存不足错误,可以使用data.table包里`dcast`函数试试。...) train <- dcast(data = traintfidf, id + label ~ term, sum, value.var = "tfidf") dcastdata.table中有用函数

1.7K20

文本情感分析:特征提取(TFIDF指标)&随机森林模型实现

(3)基于算法分析方式一般具有行业特殊性,也就是说很难训练一个可以跨行业模型,这样就会遇到另外一个问题:挑选训练样本。...书中提到,要统计tf,可以通过`table`函数、`dcast`函数(reshape2包、plyr包都有这个函数)等实现,但是尝试之后发现它们要不速度慢,要不就是占用内存太高,包括data.table...其中,data.table`dcast`函数比reshape2包里`dcast`好用,尽管他们参数都一样,但是很多人还是比较喜欢老朋友reshape2包,然而这一步需要大量内存,本书在服务器上完成...,如果你电脑报告内存不足错误,可以使用data.table包里`dcast`函数试试。...) train <- dcast(data = traintfidf, id + label ~ term, sum, value.var = "tfidf") dcastdata.table

8.6K40

R语言可以绘制ECharts交互式图表啦!

导语 GUIDE ╲ ECharts是一个基于JavaScript实现开源可视化库,可以流畅运行在PC和移动设备上,兼容当前绝大部分浏览器。...简介 recharts具有丰富功能,提供图形展示包括:地图(eMap),柱状图(eBar),折线图(eLine), 雷达图(eRadar),散点图(ePoints),漏斗图(eFunnel)以及万恶饼图...#先改造一下数据集 d <- data.table::dcast(mtcars, carb+gear~., mean, value.var='mpg') names(d)[3] <- 'mean.mpg..., 6907) ) ) ) ) echart(chordEx1) 06 南丁格尔玫瑰图 str(Titanic) # 表格按行求和,再进行转换长表达 titanic <- data.table...,但是已经具备了十分强大交互式可视化功能,小编在这里展示了一些常用图形绘制函数,仍有很多绘图功能需要大家继续发掘!

1.7K11

安装使用pyclone进行克隆演化推断

pyclone介绍   可以根据多个样品突变allele frequency 和 copy number,推断出有该突变细胞克隆所占比例(cellular prevalence)在不同样品间变化...plots/ #包括生成全部图 tables/ #包括生成全部表格 trace/ #包括MCMC抽样算法原始痕迹 yaml/ #存放yaml突变文件文件夹,用于PyClone...1或2 minor_cn, 肿瘤细胞minor拷贝数,一般从WGSS或者芯片数据预测出 major_cn,肿瘤细胞major拷贝数,一般从WGSS或者芯片数据预测出 如果你没有minor copy...hex能直接处理矩阵R函数 library(data.table) library(supraHex) Loci_tsv_To_Input <- function(dt){ dc <- dcast...(dt, formula = mutation_id ~ sample_id, value.var = "cellular_prevalence") dt_out <- dc[,-1] rownames

2.5K50

在ASP.NET MVC中如何应用多个同类ValidationAttribute?

[源代码从这里下载] 一、一个自定义ValidationAttribute:RangeIfAttribute 为了演示在相同目标元素(类、属性或者字段)应用多个同类ValidationAttribute...validationContext.DisplayName), memberNames); 27: } 28: } 二、将RangeIfAttribute应用于Employee 我们将RangeIfAttribute特性应在具有如下定义表示员工...ASP.NET MVC在生成包括验证特性Model元数据时候,针对某个元素所有ValidationAttribute是被维护在一个字典上,而这个字典值就是AttributeTypeId属性...在默认情况下,AttributeTypeId返回是自身类型,所以导致应用到相同目标元素同类ValidationAttribute只能有一个。...值得一提是:重写TypeId属性方式只能解决服务端验证问题,对于客户端认证无效。

2K60
领券