首页
学习
活动
专区
工具
TVP
发布

yw的数据分析

专栏作者
53
文章
95823
阅读量
31
订阅数
R语言ENTREZID ID 转换 gene SYMBOL
library(data.table) library(org.Hs.eg.db) library(clusterProfiler) setwd("example") dt <- read.table("VanAllen.self_subtract", sep = "\t", header = T) dt$geneid <- rownames(dt) # transform id map_dt <- bitr(dt$geneid, fromType = "ENTREZID",toType = c
用户1680321
2022-05-11
1.1K0
window下实现白天黑夜切换不同桌面
    手机已经具有白天切换白天的壁纸,晚上切换晚上的壁纸的功能,这时候我可以做到白天工作一种心情,晚上休息一种心情。但是苦于电脑一直没有这种功能,于是用vb写下windows可以使用的程序,仅提供给你每天的好心情!
用户1680321
2022-05-11
5350
生物结构变异分析软件meerkat 0.189使用笔记(二)
前面已经依序安装了meerkat 的环境和meerkat,运行了预处理一步,在相对应的bam文件目录下生成了大批文件,因此,当要用meerkat处理某个bam文件时,应先将该bam文件移动到专有的一个文件夹,manual中也建议这样用。
用户1680321
2022-03-22
7950
生物结构变异分析软件meerkat 0.189使用笔记(一)
meerkat 0.189版本和以前的版本相比,支持bwa mem 输出的bam文件,还支持全外显子数据count SV。
用户1680321
2022-03-22
5630
R语言基因组数据分析可能会用到的data.table函数整理
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完成诸多任务,另一方面是处理快,内部处理的步骤进行了程序上的优化,使用多线程,甚至很多函数是使用C写的,大大加快数据运行速度。因此,在对大数据处理上,使用data.table无疑具有极高的效率。这里主要介绍在基因组数据分析中可能会用到的函数。
用户1680321
2022-03-10
3.1K0
Linux系统 awk sed R脚本 python脚本传入变量
sed 传入变量: 1 chrI="chr2";sed -n "/$chrI/p" clippointpos.csv #变量用$var表示,把sed的单引号变为双引号即可 awk 传入变量: 1 chrI="chr2";awk '/"'$chrI'"/{print $0}' clippointpos.csv #变量用$var表示,变量两边再加上"' R脚本传入变量: 1 arg <- commandArgs(T) 2 filename=arg[1] 3 outputfile=arg[2] python
用户1680321
2022-03-10
1.4K0
R语言数据分析利器data.table包 —— 数据框结构处理精讲
    R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完成诸多任务,另一方面是处理快,内部处理的步骤进行了程序上的优化,使用多线程,甚至很多函数是使用C写的,大大加快数据运行速度。因此,在对大数据处理上,使用data.table无疑具有极高的效率。这里我们主要讲的是它对数据框结构的快捷处理。
用户1680321
2022-03-10
5.3K0
寻找与疾病相关的SNP位点——R语言从SNPedia批量提取搜索数据
   SNP是单核苷酸多态性,人的基因是相似的,有些位点上存在差异,这种某个位点的核苷酸差异就做单核苷酸多态性,它影响着生物的性状,影响着对某些疾病的易感性。SNPedia是一个SNP调査百科,它引用各种已经发布的文章,或者数据库信息对SNP位点进行描述,共享着人类基因组变异的信息。我们可以搜索某个SNP位点来寻找与之相关的信息,也可以根据相关疾病,症状来寻找相关的SNP。
用户1680321
2022-03-10
1.3K0
UCSC genome browser 个人track 安装
处理基因组数据,很多时候我们会觉得直接看序列文件不够直观,如果绘图的话,把n多G把数据用画图出来不仅费劲,就算操作也不方便。因此我们可以用UCSC开发出的genome browser,可以直接把数据信息写成track,连上genome browser 上查看,它还支持安装到本地服务器上(genome browser in box ,简称GBIB),genome browser 支持的格式有bedGraph, GTF, PSL, BED, bigBed, WIG, bigGenePred, bigMaf, bigChain, bigPsl, bigWig, BAM, CRAM, VCF, MAF, BED detail, Personal Genome SNP, broadPeak, narrowPeak, and microarray (BED15),GFF和GTF文件必须tab分隔。 废话少说,直接入门。本文主要讲SAM,BAM,WIG,bigWig,VCF,BED文件上传及使用。
用户1680321
2022-03-10
1.2K0
C++遍历二维数组的四种方法
#include <iostream> using std::cin; using std::cout; using std::endl; using std::string; using std::begin; using std::end; int main() { int ia[3][4]; size_t cnt=0; for (auto &row:ia){ for (auto &col:row){ col=cnt; ++cnt; } } conste
用户1680321
2022-03-10
8690
R语言从小木虫网页批量提取考研调剂信息
使用Rcurl包可以方便的向服务器发出请求,捕获URI,get 和 post 表单。比R socktet连接要提供更高水平的交互,并且支持 FTP/FTPS/TFTP,SSL/HTTPS,telnet 和cookies等。本文用到的函数是basicTextGatherer和getURL。想详细了解这个包的可以点击参考资料的链接。
用户1680321
2022-03-10
6810
使用R语言将微信记录制作成词云(简洁)--情人节奥义
参照百度的方法,使用同步助手。安装同步助手--连接手机(安卓苹果均可)--点击“其他功能“--点击微信图标即可进入聊天记录导出界面(非常简单)。
用户1680321
2022-03-10
7040
判断数据是否服从某一分布(二)——简单易用fitdistrplus包
对于不同的分布,有特定的偏度(skewness)和峰度(kurtosis),正态分布、均匀分布、逻辑斯谛分布、指数分布的偏度和峰度都是特定的值,在偏度-峰度图中是特定的点,而伽马分布和对数正态分布在偏度-峰度图中是一条直线,贝塔分布在偏度-峰度图中是一片区域。因此可以通过未知分布的偏度峰度值(在图中是一个观察点),与各种分布的偏度峰度点(线、区域)进行对比,判断未知分布数据大致可能的一个或几个分布。
用户1680321
2022-03-10
1.3K0
判断数据是否服从某一分布(一)
75.0 64.0 47.4 66.9 62.2 62.2 58.7 66.6 64.0 57.0 69.0 56.9 50.0 72.0 63.5
用户1680321
2022-03-10
1.6K0
10X单细胞测序细胞分类
文章对已知的多种细胞系混合后进行单细胞10X RNA测序,研究多克隆之间的互作模式。我们这里介绍里面的单细胞测序基因表达细胞分类操作。不过文章选用的是已知固有SNP进行分类,基因表达分类用于和SNP分类进行比较。
用户1680321
2021-02-22
5770
深度神经网络conda环境下载
因为使用conda下载数据有时候因为网络问题下载非常慢,因此我把conda的环境备份好,到时可以直接使用conda的conda create -n 新环境名字 –clone 环境的路径 , 直接把路径下原有的环境克隆到新环境中。
用户1680321
2020-09-21
5970
Sushi包绘制常见基因坐标图
Sushi包能绘制多种常见的基因组格式的图,包括bed, bedpe, bedgraph,Hic矩阵,也能绘制Manhattan图,基因结构图。
用户1680321
2020-09-16
4550
Linux下指定pip install和make install安装路径
在Linux下直接用pip install packageName,有些文件会被放到根目录下,如果没有sudo权限的话,是会安装失败的。这个以后我们就需要指定安装的目录了。 pip install --install-option="--prefix=绝对路径" packageName 一般编译源代码三部曲 ./configure make make install 这种默认安装路径的话,会把可执行文件拷贝到/usr/local/bin,如果没有sudo权限的话是会失败的,有两种方法指定安装路径。
用户1680321
2020-07-21
6.9K0
logistic回归
Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。 
用户1680321
2020-07-21
6850
annvar下载数据库的网址
比如想下载hg19_gwava数据,那么需要下载原始txt数据和idx文件,路径如下
用户1680321
2020-04-25
1.2K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档