首页
学习
活动
专区
工具
TVP
发布

生物信息学、python、R、linux

微信公众号及简书同号,欢迎关注~
专栏作者
359
文章
685112
阅读量
66
订阅数
GEO数据上传
1、创建账号 将数据上传到GEO数据库,首先要创建并登陆NCBI帐号, 然后进入提交的网址:https://www.ncbi.nlm.nih.gov/geo/info/submission.html 以高通量测序数据为例:
生信编程日常
2023-03-07
2.6K1
awk比较两文件(-)
发现awk比较的时候可以用-代替某一个文件,这样让整个代码更灵活: cat 2.txt | awk 'FNR==NR {x[$1];next} ($1 in x)' 1.txt - 取代第一个文件的位置: cat 2.txt | awk 'FNR==NR {x[$1];next} ($1 in x)' - 1.txt 这样在提取bam文件的信息的时候比较方面,比如: samtools view -@ 8 reads.bam | awk 'FNR==NR {x[$1];next} ($1 in x)' rea
生信编程日常
2022-09-28
7830
解决python中导出的pdf不能编辑问题
python默认输出的pdf格式是type3,这种不能在 Adobe Illustrator中编辑文字等信息,需要改成type42.
生信编程日常
2022-08-22
8211
R语言z-score转p.valueR语言z-score转p.value
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE) q就是z-score;
生信编程日常
2021-09-07
2.8K0
ggplot2 annotate文本设置意大利斜体ggplot2 annotate文本设置意大利斜体
注意保存的时候,要使用cairo_pdf()而不是pdf(),否则p有可能显示不出来。
生信编程日常
2021-09-07
1.3K0
解决devtools.install中的/bin/gtar:not found问题解决devtools.install中的/bin/gtar:not found问题
来自https://github.com/r-dbi/RPostgres/issues/110 中的解决方法。
生信编程日常
2021-09-07
6290
解决matplotlib中的Invalid DISPLAY variable错误
其实这是因为matplotlib是默认画图backend是TkAgg,这个需要有GUI的图形界面。只需要指定不需要GUI的backend就可以解决这个问题:
生信编程日常
2021-07-27
1.5K0
bigwig转bed文件
参考:https://bioinformatics.stackexchange.com/questions/2800/bigwig-to-bed-for-regions-above-below-threshold
生信编程日常
2021-06-22
2.5K0
matplotlib圆环图/饼图显示比值
构建一个显示的数值的函数,将plt.pie中的autopct=该函数即可。 代码: import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl mpl.rcParams['font.size'] = 7.0 # matplotlib设置全局字体 # 创建两组数据 x1 = [30,25, 66, 13, 23] x2 = [29, 28, 90, 19, 31] x_0 = [1,0,0,0] #用于显示空心
生信编程日常
2021-04-16
2.9K0
data.fame转list
有一个叫group_g的data.frame,想按group那一列转为list,代码如下:
生信编程日常
2021-04-09
4000
scHCL || 鉴定人的单细胞数据细胞类型
install.packages('devtools') library(devtools) # scHCL requires ggplot2/reshape2/plotly/shiny/shinythemes/shiny install_github("ggjlab/scHCL") #示例数据 library(scHCL) # hcl_lung is an example expression matrix from HCL project. data(hcl_lung) dim(hcl_lung) #[
生信编程日常
2021-03-25
9200
对10X单细胞reads进行随机抽样
此功能使用样本中的信息通过指定的道具对每个分子的读数进行下采样。然后,它基于具有非零读取计数的分子构造一个UMI计数矩阵。目的是消除技术噪声中的差异,这些差异可以按批次进行聚类,如downsampleMatrix中所述。
生信编程日常
2021-03-25
1.2K0
ggplot重新画seurat对象的聚类图
参考:https://stackoverflow.com/questions/59101791/seurat-dimplot-highlight-specific-groups-of-cells-in-different-colours
生信编程日常
2021-03-03
1K0
jupyter配置代码自动补全
linux下安装nbextensions,jupyter_nbextensions_configurator。
生信编程日常
2021-03-03
8740
cellranger拆分BCL数据
Illumina测序下机后的数据为 原始数据(raw base call )BCL文件,拿到BCL文件之后,第一步是使用cellranger的cellranger mkfastq进行拆分数据,目的是将将一个或多个lane中的混合的测序样本按照index生成对应样本的fastq文件,原理图如下:
生信编程日常
2021-02-04
1.4K0
pandas修改索引
数据如下: 目的是修改index的1-0到1. 1. rename data = data.index.map(lambda x:x.replace('1-0','1')) 2. map data.
生信编程日常
2021-01-26
7920
R安装旧版本的包
======================================== 我们目前在简书连更了365天啦,已经拿到了那个年更徽章。现在打算不定期更新记录一些笔记,公众号也会将简书的内容整理一下发布~
生信编程日常
2021-01-05
1.5K0
蛋白ID转基因ID
将Ensembl 中的蛋白ID转化成基因ID,可以通过clusterProfiler这个包。 如以大鼠的基因与蛋白转化为例; 安装clusterProfiler与大鼠org.Rn.eg.db,如果是人的注释包为org.Hs.eg.db,小鼠的注释包为org.Mm.eg.db.
生信编程日常
2020-12-31
3.4K0
URD包分析单细胞数据
因为没有找到提供的测试数据集,就用之前用seurat分析过的不同时期的心脏单细胞数据跑一边吧。E9.5_P21.combined@assays$RNA@counts取出表达矩阵,E9.5_P21.combined@meta.data取出之前的定义的每个细胞的时期以及细胞类型等信息。 1.导入数据
生信编程日常
2020-12-29
1.5K0
ggplot散点图加相关系数
计算一组数据有没有相关性以及相关程度时,可以使用cor(),以及cor.test()计算显著性,如下所示,我们想计算这两种花的长度有没有相关性。
生信编程日常
2020-12-29
5.3K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档