首页
学习
活动
专区
工具
TVP
发布

生信宝典

专栏作者
729
文章
1311123
阅读量
335
订阅数
Gut|揭示肠道微生物与COVID-19疫苗免疫效果及母婴保护的关键联系
近日,广东药科大学公共卫生学院陈青松、付曦团队,在国际著名学术期刊Gut(影响因子24.5)发表了题为 “Exploring the impact of gut microbial metabolites on inactivated SARS-CoV-2 vaccine efficacy during pregnancy and mother-to-infant antibody transfer ”的论文,揭示孕妇孕期肠道微生物与COVID-19疫苗免疫效果以及对母婴健康保护之间的关键联系。
生信宝典
2023-09-28
1420
万字长文 - Nature 综述系列 - 给生物学家的机器学习指南 4 (生物应用的挑战)
也许建模生物数据的最大挑战是生物数据的多样性。生物学家使用的数据包括基因和蛋白质序列、随时间变化的基因表达水平、进化树、显微图像、3D结构和互作网络等。我们在表2中总结了特定生物数据类型的一些最佳实践和重要注意事项。由于所遇到的数据类型的多样性,生物数据通常需要一些定制的解决方案来有效地处理它们,这使得很难推荐现成的工具,甚至是通用的机器学习指南来进行模型的选择,训练程序和测试数据将在很大程度上取决于人们想要回答的确切问题。然而,为了在生物学中成功地使用机器学习,需要考虑一些常见的问题,但也需要更广泛地考虑。
生信宝典
2023-08-30
1680
万字长文 - Nature 综述系列 - 给生物学家的机器学习指南 3 (人工神经网络)
人工神经网络模型得名于这样一个事实,即所拟合的数学模型的形式受到大脑中神经元的连接性和行为的启发,最初设计用于学习大脑的功能。然而,数据科学中常用的神经网络已不再被视为大脑的模型,而是可以在某些应用中提供最先进性能的机器学习模型。近几十年来,由于深度神经网络的架构和训练的快速发展,人们对神经网络模型的兴趣与日俱增。在本节中,我们将介绍基本的神经网络,以及在生物学研究中广泛使用的各种神经网络。其中一些如图4所示。
生信宝典
2023-08-30
1770
NBT | 微生物研究所王军组在AI赋能挖掘微生物组功能多肽方面获得新进展
抗生素耐药是现代医学面临的严峻挑战之一,在近几十年来,产生抗生素耐药性的病原微生物持续增加,每年在全球范围内耐药菌引发感染造成的死亡人数达到70万人。抗菌肽(AMPs)作为解决抗生素耐药性的候选方案之一,具有不易产生抗药性、作用快速等优势,同时因为容易降解也不会对环境造成持续性污染。因此,开发出能够应对抗多重耐药菌的新药物,缓解耐药问题迫在眉睫;但传统方法筛选新药的候选分子成功率较低,亟需高通量的挖掘和筛选手段。
生信宝典
2022-03-27
2630
王俊和尹玉新团队合作开发代谢组联合人工智能肺癌早期检测新方法
2022年2月2日,北京大学人民医院王俊院士团队和北大-清华生命科学联合中心、北京大学基础医学院尹玉新教授团队合作在Science Translational Medicine杂志上在线发表了题为“Lung cancer scRNA-seq and lipidomics reveal aberrant lipid metabolismfor early-stage diagnosis”的研究论文,应用单细胞转录组学、血浆脂质组学、机器学习和质谱成像综合分析早期肺癌的脂代谢特征,开发了一套人工智能辅助的早期肺癌代谢检测方法,并揭示了相关的分子机制。
生信宝典
2022-03-27
3260
机器学习也可以在线做!
做生信分析,Galaxy 平台应该都不陌生,里面提供了很多在线分析流程和工具,可在线使用也可以本地部署。
生信宝典
2022-03-27
5670
机器学习算法 随机森林学习 之决策树
随机森林实际是一堆决策树的组合(正如其名,树多了就是森林了)。在用于分类一个新变量时,相关的检测数据提交给构建好的每个分类树。每个树给出一个分类结果,最终选择被最多的分类树支持的分类结果。回归则是不同树预测出的值的均值。
生信宝典
2022-01-19
4030
清华姚班教师劝退文:读博,你真的想好了吗?
先简单介绍一下我的背景。我本科在University of Wisconsin-Madison,然后去CMU念了个PhD,主要研究数据库方向。目前回国在清华IIIS(姚班)做助理教授,并且 cofound 了 Singularity Data.
生信宝典
2022-01-18
3550
样本分布不平衡,机器学习准确率高又有什么用?
前面无论是用全部变量还是筛选出的特征变量、无论如何十折交叉验证调参,获得的模型应用于测试集时虽然预测准确率能在90%以上,但与不基于任何信息的随机猜测相比,这个模型都是统计不显著的 (这一点可能意义也不大,样本不平衡时看模型整体准确性无意义)。一个原因应该是样本不平衡导致的。DLBCL组的样品数目约为FL组的3倍。不通过建模而只是盲猜结果为DLBCL即可获得75%的正确率。而FL组的预测准确率却很低。
生信宝典
2022-01-18
9650
一套完整的基于随机森林的机器学习流程(特征选择、交叉验证、模型评估))
为了展示随机森林的操作,我们用一套早期的前列腺癌和癌旁基因表达芯片数据集,包含102个样品(50个正常,52个肿瘤),2个分组和9021个变量 (基因)。(https://file.biolab.si/biolab/supp/bi-cancer/projections/info/prostata.html)
生信宝典
2021-11-23
7K0
值得思考,机器学习模型做出的决策是你想要的吗?
区分预测模型和分类模型是很重要的一个事情。在很多决策应用中,分类模型代表着一个“不成熟”的决定,它组合了预测模型和决策制定,但剥夺了决策者对错误决定带来的损失的控制权 (如随机森林中的服从大多数原则,51棵树预测结果为患病49棵树预测结果为正常与91棵树预测结果为患病``9棵树预测结果为正常返回的结果都是患病)。如果采样标准或损失/收益规 (在预测疾病时,更看重敏感性而非假阳性)则发生改变,分类模型也需要相应的改变。而预测模型是与决策分开的,可用于任何决策制定。
生信宝典
2021-11-23
4090
基因表达聚类分析之初探SOM - 自组织特征图
SOM (Self-Organizing Feature Map,自组织特征图)是基于神经网络方式的数据矩阵和可视化方式。与其它类型的中心点聚类算法如K-means等相似,SOM也是找到一组中心点 (又称为codebook vector),然后根据最相似原则把数据集的每个对象映射到对应的中心点。在神经网络术语中,每个神经元对应于一个中心点。
生信宝典
2020-08-25
1K0
机器学习爱好者必读的入门指南
本指南适用于任何对机器学习(Machine Learning,ML)感兴趣但不知道从何开始的人。(莫烦Python机器学习)
生信宝典
2019-10-21
4100
手把手 | 哇!用R也可以跑Python了
如果你主要从事数据分析、统计建模和可视化,R大概是你的不二之选。但如果你还想来搞点深度学习,整个自然语言处理,那你可还真得用Python。
生信宝典
2019-05-09
8101
三人成虎,概率却不足十分之五?
你打算去西雅图旅游,但不确定是否会下雨。你打电话给三个在西雅图居住但彼此不认识的朋友询问。你的每个朋友都有2/3的可能告诉你真实情况,也有1/3的可能他们会搞砸。询问后所有的朋友都告诉你会下雨。
生信宝典
2019-05-09
1.5K0
SOM基因表达聚类分析初探
上周的暑期生信黑马培训有老师提出要做SOM分析,最后卡在code plot只能出segment plot却出不来line plot。查了下,没看到解决方案。今天看了下源码,设置了一个参数,得到趋势图。也顺便学习了SOM分析的整个过程,整理下来,以备以后用到。
生信宝典
2018-08-17
1.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档