首页
学习
活动
专区
工具
TVP
发布

小明的数据分析笔记本

专栏成员
625
文章
1086381
阅读量
113
订阅数
使用plink软件利用Fisher精确检验关联基因型和表型(GWAS)
最近看论文 Genetic subdivision and candidate genes under selection in North American grey wolves,论文里用33个狼的皮毛颜色作为表型去和基因型进行关联分析
用户7010445
2024-07-02
880
跟着NC学数据分析:R语言用分子距离/环境距离/地理距离做mantel检验
https://www.nature.com/articles/s41467-022-34206-8
用户7010445
2024-07-02
940
R语言做生态位分化分析(4)结果保存到本地自己作图
这个生态位分化分析整个的运行过程时间还是挺长的,所以想写个脚本直接在服务器上提交一个任务,最开始是想直接用save函数把运行结果保存下来。但是这个结果非常大,保存到本地以后有60多个G(暂时还没太搞懂这个数据里都有什么)。最后能用到的结果是
用户7010445
2024-07-02
910
实用软件Upscayl:增加证件照的清晰度
今天给同学发了一个证件照,忘记了这个证件照是哪里来的了清晰度不太够,查了一下有没有软件能够直接增加证件照的清晰度
用户7010445
2024-07-02
760
分享 | ATAC-Seq 分析流程
ATAC-Seq 是“Assay for Transposase-Accessible Chromatin with high-throughput Sequencing”的缩写。 ATAC-Seq 方法依赖于使用高活性转座酶 Tn5 的下一代测序(NGS)文库的构建。将 NGS 接头连接到转座酶上,该转座酶可以使染色质断裂并同时将这些接头整合到开放的染色质区域中。构建的文库可通过 NGS 测序,并使用生物信息学分析具有可及或可访问染色质的基因组区域。
用户7010445
2024-06-18
2080
R语言做生态位分化分析(2)找找参考论文
做这个分析用到的R包是 ENMtools,用到的函数是 identity.test()
用户7010445
2024-06-18
930
R语言把otu表格的绝对丰度转换为相对丰度
基本的思路是:先把otu表格宽格式转换成长格式,然后根据样本分组求和,生成一个新的列,然后用绝对丰度值除以求和列得到相对丰度,最后再转换为长格式
用户7010445
2024-06-18
1420
用R语言的circlize包复现一下Microbiome期刊中的圈图
没有找到论文中提供的数据,我们自己来构造数据,如何利用otu表格把数据整理成作图需要用的格式,这个今天的推文不做介绍,今天的推文只介绍已经有了作图需要用到的数据后如何作图。
用户7010445
2024-06-18
980
用R语言的ggplot2包复现一下Nature正刊论文中的气泡图
https://www.nature.com/articles/s41586-023-06877-w
用户7010445
2024-06-18
1150
R语言ggplot2复现一下CELL论文中的基因共线性图
https://www.sciencedirect.com/science/article/pii/S0092867424004732
用户7010445
2024-06-18
1210
minimap2+svim-asm+SURVIVOR流程基于基因组组装做结构变异检测
代码主要参考 GraffiTE 的代码,链接https://github.com/cgroza/GraffiTE/blob/main/main.nf这个工具是利用二代测序数据给TE做基因型分型然后研究TE多态性的。前面的步骤是基于组装好的基因组进行比对检测结构变异。我们把这部分代码拆出来学习一下。
用户7010445
2024-06-07
1230
R语言里将vcf文件转换为GenAlEx格式数据
https://grunwaldlab.github.io/Population_Genetics_in_R/Data_Preparation.html
用户7010445
2024-06-07
1200
R语言里做生态位分化分析(1)背景知识查询
发现ggtree的作者Y叔也关注了这个R包的作者的github。那这个作者也是个大佬无疑了。
用户7010445
2024-06-07
1150
学习Nature正刊论文中eQTL分析前对基因表达量的预处理
https://www.nature.com/articles/s41586-022-04808-9
用户7010445
2024-06-07
830
评估 beagle 基因型填充的准确率
最简单的一个思路,只保留vcf文件中不包含任何缺失数据的位点。然后随机把某些样本的部分位点替换成缺失,用beagle做基因型填充,比较填充后和填充前的一致性。
用户7010445
2024-05-29
1350
如何随机选择vcf文件中的变异位点
现在做群体基因组的论文大部分会公开自己论文分析中的变异检测结果,通常是vcf文件,我们自己可以把vcf文件下载下来试着复现论文中的内容,有时候vcf文件过大,每一步处理起来都会花费比较长的时间。有时候就想把这个vcf文件缩小,随机选择一部分。
用户7010445
2024-05-28
1280
跟着Nature学数据分析:plink计算SNP和SV之间的连锁不平衡R方值
https://www.nature.com/articles/s41586-022-04808-9
用户7010445
2024-05-27
2380
R语言利用vcf文件计算等位基因频率和连锁不平衡(LD)R方
https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-022-08418-7
用户7010445
2024-05-27
1240
使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1909-7
用户7010445
2024-05-27
1300
跟着Nature学数据分析:minimap2+DeepVariant流程利用hifi数据检测snp和indel
https://github.com/YaoZhou89/TGG/tree/main/4.Graph_pangenome/1.construction_graph_genome
用户7010445
2024-05-18
2130
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档