首页
学习
活动
专区
工具
TVP
发布

小明的数据分析笔记本

专栏作者
598
文章
999573
阅读量
111
订阅数
使用python的streamlit模块搭建一个简易的网页版blast
https://docs.streamlit.io/library/get-started/create-an-app
用户7010445
2023-01-06
1K0
学python:使用python的pyRanges模块中的read_gtf函数读取gtf文件报错的解决办法
https://biocore-ntnu.github.io/pyranges/loadingcreating-pyranges.html
用户7010445
2023-01-06
9370
跟着Nature Communications学数据分析:R语言做随机森林模型并对变量重要性排序
https://www.nature.com/articles/s41467-022-31833-z#data-availability
用户7010445
2023-01-06
2.2K0
跟着NatureGenetics学作图:R语言ggplot2做进化树图及添加不同形状的背景色块
https://www.nature.com/articles/s41588-022-01127-7#Sec31
用户7010445
2023-01-06
1.1K0
跟着Nature学作图:R语言ggplot2散点图和添加辅助线完整示例
https://www.nature.com/articles/s41586-022-04808-9#MOESM8
用户7010445
2023-01-06
4860
跟着Nature Plants学作图:R语言ggplot2画变种火山图
https://www.nature.com/articles/s41477-022-01146-6#Sec44
用户7010445
2023-01-06
4350
R语言ggplot2作图如果文字标签包含罗马数字,如何输出pdf呢?
比如这个Arial字体下就找不到罗马数字的内容,需要到 Times New Roman字体下才能找到罗马数字
用户7010445
2022-04-08
1.3K0
R语言ggplot2画气泡图展示富集分析的结果
之前的推文介绍了画柱形图展示富集分析的结果R语言ggplot2做柱形图展示富集分析的结果,今天的推文介绍一下画气泡图展示富集分析结果的代码。气泡图就是散点图的一个变种。多了一个变量映射给点的大小,富集分析里通常是用来映射基因的数量。比如下图
用户7010445
2022-02-21
3.2K0
推荐植物生物信息学参考书Plant Bioinformatics Methods and Protocols》第三版
找论文的时候偶然发现的这本参考书,个人感觉内容还挺丰富的,在这里推荐给大家 书名是 《Plant Bioinformatics Methods and Protocols》third edition
用户7010445
2022-02-21
6010
推荐R语言入门学习参考资料
不光有文字介绍,结尾还有视频,非常好的学习素材 打开这份教程的主页,发现还有好多其他内容,在这里推荐给大家
用户7010445
2021-12-09
3890
跟着Nature Microbiology学作图:R语言ggplot2用单列数据做柱形图
这篇论文中的数据是公开的,争取把论文中的图都复现一下,今天的推文复现Figure3 a 和 b ,这两个类型一样,都是柱形图
用户7010445
2021-12-01
4820
跟着Cell学作图:R语言ggplot2做蜂群图的简单小例子
https://www.sciencedirect.com/science/article/pii/S0092867421008916#da0010
用户7010445
2021-10-13
1.6K0
R语言做t-SNE降维的一个简单小例子
之前有人在公众号留言问过用R语言如何实现t-SNE降维,今天的推文介绍一下R语言实现的代码,主要内容参考自链接 https://datavizpyr.com/how-to-make-tsne-plot-in-r/
用户7010445
2021-09-22
7680
R语言实现评估随机森林模型以及重要预测变量的显著性
说到随机森林(random forest,RF),想必很多同学都不陌生了,毕竟这些机器学习方法目前非常流(fàn)行(làn)……白鱼同学也曾分别分享过“随机森林分类”以及“随机森林回归”在R语言中实现的例子,包括模型拟合、通过预测变量的值预测响应变量的值、以及评估哪些预测变量是“更重要的”等。在这两篇推文中,都是使用randomForest包执行的分析。不过在实际应用中,比方说想模仿一些文献的分析过程时,却发现某些统计无法通过randomForest包实现?
用户7010445
2021-08-31
16.1K1
R语言randomForest包的随机森林分类模型以及对重要变量的选择
随机森林(random forest)是一种组成式的有监督学习方法,可视为决策树的扩展。
用户7010445
2021-08-31
22.2K4
R语言计算两组数据变量之间的相关系数和P值的简单小例子~应用于lncRNA的trans-act
比如 Horticulture Research 中的论文 Comparative analysis of long noncoding RNAs in angiosperms and characterization of long noncoding RNAs in response to heat stress in Chinese cabbage 方法部分写道
用户7010445
2021-07-30
5.8K0
Nat Commun&JAMA INTERN MED|浅析两篇LASSO+Logistic/Cox 套路文章
两篇文章分别是来自NATURE COMMUNICATIONS的Early triage of critically ill COVID-19 patients using deep learning(doi:10.1038/s41467-020-17280-8)和 JAMA Internal Medicine的Development and Validation of a Clinical Risk Score to Predict the Occurrence of Critical Illness in Hospitalized Patients With COVID-19( doi:10.1001/jamainternmed.2020.2033).
用户7010445
2021-07-12
7720
R语言ggplot2作图如何去掉图例中的NA
https://stackoverflow.com/questions/45493163/ggplot-remove-na-factor-level-in-legend
用户7010445
2021-07-12
3.9K0
跟着Nature Genetics学二代测序数据分析:使用NOVOPlasty组装生菜的叶绿体基因组
NOVOPlasty 软件的配置文件是 lettuce2020/NOVOplasty.config.txt at master · popgenome/lettuce2020 (github.com)
用户7010445
2021-05-07
1.9K0
细胞器基因组组装利器~GetOrganelle~推荐组装命令介绍
GetOrganelle推荐组装命令介绍--reads开始 优先推荐的命令--auto(高等植物叶绿体基因组) get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant_pt -o output-plastome -R 10 -t 1 -k 21,45,65,85,105 命令中的参数说明 -1和-2 正向和反向测序原始数据文件 (如果是单向测序, -u) -F 设定要组装的基
用户7010445
2021-04-21
6.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档