腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
生信宝典
专栏作者
举报
730
文章
1313649
阅读量
335
订阅数
订阅专栏
申请加入专栏
全部文章(730)
数据分析(85)
python(75)
https(75)
数据库(69)
网络安全(67)
编程算法(59)
数据(59)
其他(56)
r 语言(50)
linux(50)
sql(38)
大数据(33)
论文(32)
开发(30)
程序(27)
工作(27)
视频(27)
机器学习(26)
http(26)
教程(26)
na(25)
模型(25)
基础(23)
字符串(21)
cell(20)
互联网医疗(18)
工具(18)
html(17)
生物基因(17)
编码(17)
设计(17)
神经网络(16)
测试(16)
系统(16)
git(15)
tcp/ip(15)
go(14)
github(14)
深度学习(13)
腾讯云开发者社区(13)
图像处理(12)
开源(12)
人工智能(11)
nat(11)
data(11)
连接(11)
事件(11)
bash(10)
网站(10)
数据处理(10)
网络(10)
ggplot2(9)
算法(9)
研发(9)
bash 指令(8)
腾讯云测试服务(7)
医疗(7)
存储(7)
队列(7)
unix(6)
产品(6)
搜索(6)
决策树(5)
安全(5)
数据可视化(5)
alpha(5)
chatgpt(5)
marker(5)
函数(5)
统计(5)
异常(5)
NLP 服务(4)
云数据库 SQL Server(4)
容器镜像服务(4)
shell(4)
windows(4)
com(4)
count(4)
编程(4)
管理(4)
进程(4)
科技(4)
可视化(4)
框架(4)
索引(4)
原理(4)
数据挖掘(3)
java(3)
perl(3)
react(3)
node.js(3)
css(3)
ide(3)
日志服务(3)
grep(3)
markdown(3)
anaconda(3)
es(3)
aes(3)
axis(3)
bi(3)
dplyr(3)
shadow(3)
transition(3)
百度(3)
表格(3)
对象(3)
翻译(3)
排序(3)
优化(3)
php(2)
android(2)
硬件开发(2)
matlab(2)
apache(2)
批量计算(2)
NAT 网关(2)
爬虫(2)
正则表达式(2)
numpy(2)
迁移学习(2)
机器人(2)
数据结构(2)
汽车(2)
analysis(2)
cut(2)
exit(2)
filter(2)
fold(2)
for循环(2)
frame(2)
ip(2)
layout(2)
line(2)
list(2)
matplotlib(2)
matrix(2)
pandas(2)
parameters(2)
plot(2)
row(2)
sample(2)
sequence(2)
sf(2)
table(2)
time(2)
tree(2)
txt(2)
umi(2)
view(2)
备份(2)
变量(2)
插件(2)
登录(2)
地图(2)
服务器(2)
工程化(2)
量化(2)
生命周期(2)
性能(2)
重构(2)
对象存储(1)
官方文档(1)
区块链(1)
ios(1)
javascript(1)
.net(1)
json(1)
typescript(1)
云数据库 Redis(1)
web.py(1)
搜索引擎(1)
windows server(1)
黑石物理服务器(1)
文件存储(1)
短视频(1)
访问管理(1)
TDSQL MySQL 版(1)
SSL 证书(1)
TAPD 敏捷项目管理(1)
文字识别(1)
腾讯移动分析(1)
云推荐引擎(1)
双螺旋(1)
高性能计算(1)
企业(1)
express(1)
容器(1)
游戏(1)
自动化(1)
缓存(1)
数据迁移(1)
ssh(1)
面向对象编程(1)
线性回归(1)
模式识别(1)
sas(1)
notepad ++(1)
迁移(1)
流计算 Oceanus(1)
教育(1)
accessibility(1)
adobe(1)
alignment(1)
ast(1)
average(1)
awk(1)
barcode(1)
bioinformatics(1)
break(1)
bug(1)
capture(1)
cas(1)
case(1)
center(1)
char(1)
combine(1)
communication(1)
composition(1)
conda(1)
coordinates(1)
dataframe(1)
dataset(1)
edge(1)
edit(1)
error(1)
espresso(1)
excel(1)
export(1)
facebook(1)
file(1)
fread(1)
free(1)
fs(1)
function(1)
graph(1)
grid(1)
having(1)
host(1)
igraph(1)
input(1)
int(1)
integration(1)
it(1)
key(1)
lag(1)
landscape(1)
lda(1)
legend(1)
mamp(1)
merge(1)
min(1)
nas(1)
null(1)
ode(1)
office(1)
output(1)
parsing(1)
pdb(1)
pdf(1)
point(1)
position(1)
public(1)
random(1)
resources(1)
return(1)
scale(1)
self(1)
shapes(1)
signature(1)
similarity(1)
slide(1)
spatial(1)
spock(1)
statistics(1)
structure(1)
tools(1)
unique(1)
unsigned(1)
viewport(1)
word(1)
zip(1)
布局(1)
代理(1)
动画(1)
分页(1)
服务(1)
行业(1)
互联网(1)
集群(1)
解决方案(1)
镜像(1)
开发工具(1)
快捷键(1)
浏览器(1)
漏洞(1)
配色(1)
配置(1)
软件(1)
数据管理(1)
数学(1)
数组(1)
调试(1)
同步(1)
通信(1)
效率(1)
芯片(1)
压缩(1)
语音(1)
源码(1)
搜索文章
搜索
搜索
关闭
全代码 | 随机森林在回归分析中的经典应用
机器学习
变量
模型
数据
统计
公众号后台记录了发表过文章的各项阅读指标包括:内容标题,总阅读人数,总阅读次数,总分享人数,总分享次数,阅读后关注人数,送达阅读率,分享产生阅读次数,首次分享率,每次分享带来阅读次数,阅读完成率。
生信宝典
2023-09-12
394
0
万字长文 - Nature 综述系列 - 给生物学家的机器学习指南 4 (生物应用的挑战)
机器学习
神经网络
测试
模型
数据
也许建模生物数据的最大挑战是生物数据的多样性。生物学家使用的数据包括基因和蛋白质序列、随时间变化的基因表达水平、进化树、显微图像、3D结构和互作网络等。我们在表2中总结了特定生物数据类型的一些最佳实践和重要注意事项。由于所遇到的数据类型的多样性,生物数据通常需要一些定制的解决方案来有效地处理它们,这使得很难推荐现成的工具,甚至是通用的机器学习指南来进行模型的选择,训练程序和测试数据将在很大程度上取决于人们想要回答的确切问题。然而,为了在生物学中成功地使用机器学习,需要考虑一些常见的问题,但也需要更广泛地考虑。
生信宝典
2023-08-30
169
0
万字长文 - Nature 综述系列 - 给生物学家的机器学习指南 3 (人工神经网络)
机器学习
神经网络
模型
数据
网络
人工神经网络模型得名于这样一个事实,即所拟合的数学模型的形式受到大脑中神经元的连接性和行为的启发,最初设计用于学习大脑的功能。然而,数据科学中常用的神经网络已不再被视为大脑的模型,而是可以在某些应用中提供最先进性能的机器学习模型。近几十年来,由于深度神经网络的架构和训练的快速发展,人们对神经网络模型的兴趣与日俱增。在本节中,我们将介绍基本的神经网络,以及在生物学研究中广泛使用的各种神经网络。其中一些如图4所示。
生信宝典
2023-08-30
179
0
Briefings in Bioinformatics | 王秀杰/裴小兵合作开发单细胞组学细胞标记基因鉴定算法COSG
机器学习
在单细胞测序数据分析中,对细胞进行准确分类是数据分析的重要基础。在利用聚类算法将细胞进行分组后,需要通过鉴定不同细胞群特异表达的标记基因来注释细胞类型。同时,细胞标记基因在所有细胞类群中的表达模式也能够帮助判断聚类、标准化、批次效应校正等分析结果的准确性,进而进行参数优化。然而,如何准确鉴定不同细胞类型的细胞标记基因 (cell marker gene)仍面临巨大的挑战。
生信宝典
2022-03-27
356
0
王俊和尹玉新团队合作开发代谢组联合人工智能肺癌早期检测新方法
机器学习
神经网络
深度学习
人工智能
2022年2月2日,北京大学人民医院王俊院士团队和北大-清华生命科学联合中心、北京大学基础医学院尹玉新教授团队合作在Science Translational Medicine杂志上在线发表了题为“Lung cancer scRNA-seq and lipidomics reveal aberrant lipid metabolismfor early-stage diagnosis”的研究论文,应用单细胞转录组学、血浆脂质组学、机器学习和质谱成像综合分析早期肺癌的脂代谢特征,开发了一套人工智能辅助的早期肺癌代谢检测方法,并揭示了相关的分子机制。
生信宝典
2022-03-27
326
0
机器学习也可以在线做!
机器学习
神经网络
深度学习
人工智能
做生信分析,Galaxy 平台应该都不陌生,里面提供了很多在线分析流程和工具,可在线使用也可以本地部署。
生信宝典
2022-03-27
569
0
机器学习算法 随机森林学习 之决策树
编程算法
决策树
机器学习
神经网络
深度学习
随机森林实际是一堆决策树的组合(正如其名,树多了就是森林了)。在用于分类一个新变量时,相关的检测数据提交给构建好的每个分类树。每个树给出一个分类结果,最终选择被最多的分类树支持的分类结果。回归则是不同树预测出的值的均值。
生信宝典
2022-01-19
403
0
清华姚班教师劝退文:读博,你真的想好了吗?
决策树
机器学习
神经网络
深度学习
人工智能
先简单介绍一下我的背景。我本科在University of Wisconsin-Madison,然后去CMU念了个PhD,主要研究数据库方向。目前回国在清华IIIS(姚班)做助理教授,并且 cofound 了 Singularity Data.
生信宝典
2022-01-18
356
0
样本分布不平衡,机器学习准确率高又有什么用?
编程算法
决策树
机器学习
神经网络
深度学习
前面无论是用全部变量还是筛选出的特征变量、无论如何十折交叉验证调参,获得的模型应用于测试集时虽然预测准确率能在90%以上,但与不基于任何信息的随机猜测相比,这个模型都是统计不显著的 (这一点可能意义也不大,样本不平衡时看模型整体准确性无意义)。一个原因应该是样本不平衡导致的。DLBCL组的样品数目约为FL组的3倍。不通过建模而只是盲猜结果为DLBCL即可获得75%的正确率。而FL组的预测准确率却很低。
生信宝典
2022-01-18
968
0
一套完整的基于随机森林的机器学习流程(特征选择、交叉验证、模型评估))
编程算法
机器学习
决策树
神经网络
深度学习
为了展示随机森林的操作,我们用一套早期的前列腺癌和癌旁基因表达芯片数据集,包含102个样品(50个正常,52个肿瘤),2个分组和9021个变量 (基因)。(https://file.biolab.si/biolab/supp/bi-cancer/projections/info/prostata.html)
生信宝典
2021-11-23
7K
0
值得思考,机器学习模型做出的决策是你想要的吗?
编程算法
机器学习
决策树
神经网络
深度学习
区分预测模型和分类模型是很重要的一个事情。在很多决策应用中,分类模型代表着一个“不成熟”的决定,它组合了预测模型和决策制定,但剥夺了决策者对错误决定带来的损失的控制权 (如随机森林中的服从大多数原则,51棵树预测结果为患病49棵树预测结果为正常与91棵树预测结果为患病``9棵树预测结果为正常返回的结果都是患病)。如果采样标准或损失/收益规 (在预测疾病时,更看重敏感性而非假阳性)则发生改变,分类模型也需要相应的改变。而预测模型是与决策分开的,可用于任何决策制定。
生信宝典
2021-11-23
409
0
机器学习爱好者必读的入门指南
机器学习
神经网络
深度学习
人工智能
编程算法
本指南适用于任何对机器学习(Machine Learning,ML)感兴趣但不知道从何开始的人。(莫烦Python机器学习)
生信宝典
2019-10-21
410
0
有了这款神器,人人都是作曲家!
python
https
网络安全
机器学习
摘要:人工智能作曲APP Amper Music的简单介绍和测评,以及人工智能和机器学习的小科普
生信宝典
2019-10-15
4.8K
0
手把手 | 哇!用R也可以跑Python了
python
numpy
机器学习
神经网络
如果你主要从事数据分析、统计建模和可视化,R大概是你的不二之选。但如果你还想来搞点深度学习,整个自然语言处理,那你可还真得用Python。
生信宝典
2019-05-09
810
1
三人成虎,概率却不足十分之五?
机器学习
神经网络
深度学习
人工智能
你打算去西雅图旅游,但不确定是否会下雨。你打电话给三个在西雅图居住但彼此不认识的朋友询问。你的每个朋友都有2/3的可能告诉你真实情况,也有1/3的可能他们会搞砸。询问后所有的朋友都告诉你会下雨。
生信宝典
2019-05-09
1.5K
0
PCA主成分分析实战和可视化 | 附R代码和测试数据
机器学习
一文看懂PCA主成分分析中介绍了PCA分析的原理和分析的意义(基本简介如下,更多见博客),今天就用数据来实际操练一下。
生信宝典
2018-12-29
3K
0
生信宝典之傻瓜式(四)蛋白蛋白互作网络在线搜索
大数据
机器学习
傻瓜系列重启了,今天要介绍的是一款在线查询蛋白-蛋白互作网络的工具 STRING (https://string-db.org/)。 STRING数据库收录了2031个物种,9.6 Million个蛋
生信宝典
2018-02-05
2.5K
0
Python学习 - 可视化变量赋值、循环、程序运行过程
python
机器学习
Python Tutor (http://www.pythontutor.com/)是`Philip Guo`开发的,通过把计算机运行程序代码的过程可视化的展示来帮助克服程序学习最初的障碍。 这款线上工具支持Python 2, Python 3, Java, JavaScript, TypeScript, Ruby, C和C++代码。累计有多于180个国家三百五十万多人次使用。通过它可视化运行的代码有三千万之多。 下面的动图展示了一段Python程序的变量赋值,变量交换,列表赋值,列表增删,循环,判断,全
生信宝典
2018-02-05
1.3K
0
Python学习没有捷径,但可以加速,零基础九天你也可以会编程
python
机器学习
在小学生都学Python了,你还不知道怎么开始文中介绍了Python的应用广泛,功能强大,提供了Python的在线学习视频和资料等 (收集资料是我们的最爱)。 学习程序语言不是一件难事,也不是一件简单
生信宝典
2018-02-05
827
0
R语言学习 - 柱状图
机器学习
柱状图绘制 柱状图也是较为常见的一种数据展示方式,可以展示基因的表达量,也可以展示GO富集分析结果,基因注释数据等。 常规矩阵柱状图绘制 有如下4个基因在5组样品中的表达值 data_ori <- "Grp_1;Grp_2;Grp_3;Grp_4;Grp_5 a;2.6;2.9;2.1;2.0;2.2 b;20.8;9.8;7.0;3.7;19.2 c;10.0;11.0;9.2;12.4;9.6 d;9;3.3;10.3;11.1;10" data <- read.table(text=data_ori
生信宝典
2018-02-05
2.4K
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档