首页
学习
活动
专区
工具
TVP
发布

生信技能树

专栏作者
1910
文章
3602454
阅读量
1134
订阅数
很容易解释的单细胞机器学习分类树
无论是随机森林,LASSO回归,还是支持向量机, 他们的模型都是有点抽象,不容易直观的可视化解释清楚。但是接下来我们要介绍的决策树模型,就不一样。
生信技能树
2023-02-28
4420
LASSO回归也可以用来做单细胞分类
首先,复制粘贴前面的 一个完美的单细胞亚群随机森林分离器是如何炼成的 ,就可以拿到上面代码里面的两个rdata文件哈,然后得到的 rf_importances 这个数据里面有各个单细胞亚群对应的基因。
生信技能树
2022-12-16
7020
一个完美的单细胞亚群随机森林分离器是如何炼成的
虽然两个CD4的T细胞其实大量共享高表达量基因,两个单核细胞也是如此,而CD8和NK也是如此,所以它们的AddModuleScore打分也是有些微混杂,不过最重要的问题是我们的可视化并没有体现出来AddModuleScore打分是否是足够好的分类器。
生信技能树
2022-12-16
4840
基于支持向量机模型的TNBC的分子亚型预测
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!有做ngs实战整理的,也有做临床数据挖掘算法工具介绍的。今天分享的是复旦大学和西北民族大学小伙伴合作的笔记
生信技能树
2022-06-27
6640
机器学习or深度学习,都不可错过的开源库AutoGluon
有意思的是福建医科大学的一位小伙伴并没有走我的ngs之路,反而去琢磨机器学习人工智能啦,也开始投稿!
生信技能树
2021-07-06
2.5K0
lncRNA组装流程的软件介绍之lncFinder
LncFinder是一种新的lncRNA识别工具。基于六聚体的对数距离,多尺度结构信息和从快速离散傅立叶变换获得的理化特征。为了确定最佳分类器,使用10倍交叉验证对五种广泛使用的机器学习算法进行了验证:逻辑回归,支持向量机(SVM),随机森林,极限学习机器和深度学习。最终选择SVM作为LncFinder的分类器。经过全面的功能选择和模型验证方案的评估,LncFinder在多个物种上的表现优于几种最先进的工具。用户可以轻松,高效地使用新的数据集或不同的机器学习算法对LncFinder进行重新训练。
生信技能树
2021-07-06
9190
跟着生信技能树,学习 CIBERSORT
首先有一些背景知识需要了解(特别是一些算法),但是我的理解方法特别粗暴,不知道Jimmy老师会不会打我。当然了,如果是原始的CIBERSORT R脚本 https://rdrr.io/github/singha53/amritr/src/R/supportFunc_cibersort.R 其实懂得使用即可。
生信技能树
2021-02-03
6.4K1
什么,他来了!
而且该专栏的主理人“冰糖”持续3年都在追踪该视频的最新进展,及时以文字解读版本分享给大家,见:冰糖的专栏总结
生信技能树
2021-01-18
4720
这3个lncRNA组成的食管癌诊断分类器在tcga数据库能否复现
看起来似乎是Agilent和CBC公司合作,所以芯片平台是:Agilent-038314 CBC Homo sapiens lncRNA + mRNA microarray V2.0 (Feature Number version) ,从有表达差异的基因列表里面筛选到最后的3个lncRNA组成的食管癌诊断分类器基因集,过程比较复杂,如下:
生信技能树
2020-05-06
7160
cibersoft使用SVM算法实现去卷积
因为表达矩阵通常是bulk转录组测序,也就是说本来就是肿瘤细胞以及其肿瘤微环境的各种其他细胞组合而成,同理我们应该是可以根据表达量推断出来他们的细胞组分,当然,这个就需要算法上面的突破啦,下面我们就介绍一些相关方向的进展。
生信技能树
2020-04-20
1.6K1
kNN算法根据不同病理特征来预测乳腺癌转移与否
本文介绍机器学习中的分类算法kNN(k-NearestNeighbor),即k邻近算法。核心思想类似“近朱者赤近墨者黑”,每个样本都可以用它最接近的k个邻居来代表。
生信技能树
2019-12-05
1.8K0
sklearn入门教程:监督学习流程与线性分类器
监督学习是机器学习中的一个方法,其原理是根据已有经验知识对未知样本的目标/标记进行预测。根据目标预测变量的类型不同,我们可以把监督学习任务大体分为分类学习(预测一个分类标签)与回归预测(函数输出是一个连续的值)两类。
生信技能树
2019-05-15
1.1K0
MATH值量化肿瘤异质性有一定的临床意义
但是作者后续的分析,只挑选了more functional (MF) mutations, 就是那些被PolyPhen-2软件认定为是“probably damaging” or “possibly damaging” 的 469,553 位点。
生信技能树
2019-05-08
1.5K0
把rstudio的project或者package同步到自己的GitHub
然后rstudio的git/svn需要设置好秘钥连接到自己的GitHub, 参考生信菜鸟团博客教程:http://www.bio-info-trainee.com/2477.html 这个需要仔细理解。 (需要耗时30分钟)
生信技能树
2018-08-16
1.3K0
学习三维基因组数据处理前的准备工作
毫无疑问,处理数据的首要条件是理解数据从产生,对应到我们这个系列,也就是了解三维基因组的背景知识,如下:
生信技能树
2018-08-06
7810
使用R包genefu来根据基因集进行表达谱分类
教程略微有点复杂:https://rdrr.io/bioc/genefu/f/inst/doc/genefu.pdf
生信技能树
2018-07-27
2.3K0
单细胞转录组3大R包之monocle2
主要是针对单细胞转录组测序数据开发的,用来找不同细胞类型或者不同细胞状态的差异表达基因。分析起始是表达矩阵,作者推荐用比较老旧的Tophat+Cufflinks流程,或者RSEM, eXpress,Sailfish,等等。需要的是基于转录本的表达矩阵,我一般用subjunc+featureCounts 来获取表达矩阵。 2014年版本 由Cole Trapnell 于2014年在Nature Biotechnology 杂志发表,是一个略微复杂的R包,并给出了一个测试数据 ,下载地址是: Source co
生信技能树
2018-03-09
20.2K2
比对NR库看看物种分布【直播】我的基因组88
前面我提前了我的基因组测序数据里面的未成功比对到人类基因组上面的那些fastq序列,也用了软件把它们组装成fasta序列,这些序列的功能是未知的,可以通过比对到NCBI的NT/NR库来给他们注释一下。 NR库是Non-redundant protein sequences from GenPept, Swissprot, PIR, PDF, PDB, and NCBI RefSeq,得去ftp://ftp.ncbi.nih.gov/blast/db/ 下载所有gz结尾的文件,并且解压到同一个目录即可。 最终
生信技能树
2018-03-09
2.6K1
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档