首页
学习
活动
专区
工具
TVP
发布

yw的数据分析

专栏作者
53
文章
97173
阅读量
31
订阅数
生物结构变异分析软件meerkat 0.189使用笔记(二)
前面已经依序安装了meerkat 的环境和meerkat,运行了预处理一步,在相对应的bam文件目录下生成了大批文件,因此,当要用meerkat处理某个bam文件时,应先将该bam文件移动到专有的一个文件夹,manual中也建议这样用。
用户1680321
2022-03-22
8090
R语言读入数据库的中英名词互译测试并计分脚本(考试用)
    1. 分子生物学中英文.csv,输入文件,两列,以tab键分隔的txt文本,没有列名
用户1680321
2019-03-15
4570
ONCOCNV软件思路分析之tumor处理
前期处理 perl脚本统计RC(RC(read counts)) 读入control baseline 和 sigma(最后baseline 预测的mad值) 将gc < 0.28或gc > 0.68,sigma乘上1.5,后来又乘以6,对于小于0.01或者大于0.99分位数,sigma取0.01和0.99分位点的sigma 将sigma转化为权重,SigmaForWeights = 1/sigma^2/max(1/sigmaforWeithts^2) 根据mu值设置一些outlier的amplicon,t
用户1680321
2018-04-28
1.2K0
gplots heatmap.2和ggplot2 geom_tile实现数据聚类和热图plot
主要步骤 ggplot2 数据处理成矩阵形式,给行名列名 hclust聚类,改变矩阵行列顺序为聚类后的顺序 melt数据,处理成ggplot2能够直接处理的数据结构,并加上列名 ggplot_tile进行画图 gplots 数据处理成矩阵形式,给行名列名 调制颜色并用heatmap.2画热图(heatmap.2函数内部用hclustfun 进行聚类) R语言代码 library(ggplot2) library(data.table) CN_DT <- fread("/home/ywliao/projec
用户1680321
2018-04-28
4.7K0
R语言进行机器学习方法及实例(一)
  机器学习的研究领域是发明计算机算法,把数据转变为智能行为。机器学习和数据挖掘的区别可能是机器学习侧重于执行一个已知的任务,而数据发掘是在大数据中寻找有价值的东西。 机器学习一般步骤 收集数据,将数据转化为适合分析的电子数据 探索和准备数据,机器学习中许多时间花费在数据探索中,它要学习更多的数据信息,识别它们的微小差异 基于数据训练模型,根据你要学习什么的设想,选择你要使用的一种或多种算法 评价模型的性能,需要依据一定的检验标准 改进模型的性能,有时候需要利用更高级的方法,有时候需要更换模型 机器学习算法
用户1680321
2018-04-27
3.2K0
R语言各种假设检验实例整理(常用)
一、正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下:                  159 280 101 212 224 379 179 264                   222 362 168 250 149 260 485 170     问是否有理由认为元件的平均寿命大于255小时? 解:按题意,需检验                      H0: μ ≤ 225 H1: μ > 225    
用户1680321
2018-04-27
4.1K0
R语言实现对基因组SNV进行注释
    很多时候,我们需要对取出的SNV进行注释,这个时候可能会在R上进行注释,通常注释文件都含有Chr(染色体)、Start(开始位点)、End(结束位点)、Description(描述),而我们的SNV文件通常是拥有Position(位置),因此我们可以先定位Chr,再用Postion去定位到Start和End之间,找到相对应的Description。为了加快速度,可以使用二分查找法。 1 for (value in dt$value){ 2 #df:data.frame, V1 and V2 sh
用户1680321
2018-04-27
1.2K0
R语言实现二分查找法
二分查找时间复杂度O(h)=O(log2n),具备非常高的效率,用R处理数据时有时候需要用到二分查找法以便快速定位 1 Rbisect <- function(lst, value){ 2 low=1 3 high=length(lst) 4 mid=length(lst)%/%2 5 if (lst[low]==value) low 6 else if (lst[high]==value) high 7 else{ 8 while (
用户1680321
2018-04-27
1.1K0
R语言写2048游戏
       2048 是一款益智游戏,只需要用方向键让两两相同的数字碰撞就会诞生一个翻倍的数字,初始数字由 2 或者 4 构成,直到游戏界面全部被填满,游戏结束。        编程时并未查看原作者
用户1680321
2018-04-27
2.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档