首页
学习
活动
专区
工具
TVP
发布

生信技能树

专栏成员
1974
文章
3977002
阅读量
1167
订阅数
如何让更多人宣传你的科研成果?
中国地区在CNS期刊(即《Cell》、《Nature》和《Science》)上发表的文章情况近年来一直呈上升趋势:
生信技能树
2024-07-26
900
CellChat细胞通讯
细胞通讯是单细胞数据高级分析中比较常见的一个,我们习惯使用的R包是CellChat。
生信技能树
2024-06-21
2850
单细胞亚群的命名的细致程度需要有一个度
可以看到,这个时候已经是有了 M1 macrophages, natural killer T (NKT) cells, plasma cells 这样的单细胞亚群:
生信技能树
2024-06-19
1720
单细胞亚群合理命名是数据分析基石啊
其实这样的笑话在单细胞数据挖掘文章里面层出不穷,比如另外一个数据挖掘文章;《Identification of Five Hub Genes Based on Single-Cell RNA Sequencing Data and Network Pharmacology in Patients With Acute Myocardial Infarction》,链接是:https://www.frontiersin.org/articles/10.3389/fpubh.2022.894129/full ,里面的bug就更可怕了,居然是把成纤维细胞错误的命名成为了单核细胞。如下所示:
生信技能树
2024-06-08
1790
作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
研究者们在GEO数据库是有数据分享:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE182923
生信技能树
2024-06-08
2160
蛋白质组学上游数据处理知多少
对大家来说,耳熟能详的软件就是 MaxQuant 啦,在综述文章《Bioinformatics Methods for Mass Spectrometry-Based Proteomics Data Analysis》有详细的介绍各种软件的对比汇总。
生信技能树
2024-06-08
3900
蛋白质组学公共数据库资源汇总
但是蛋白质组数据库并不是蛋白质数据库,主要是ProteomeXchange联盟,它是一个开放的、公共的数据存储平台,专门用于存储和共享质谱(MS)数据。它由多个蛋白质组学数据存储库组成,包括PRIDE Archive、MassIVE、PeptideAtlas 以及iProX等 。
生信技能树
2024-06-08
8170
可以每一条代谢通路都激活吗
其中附件有一张图是男性和女性的乳腺癌患者肿瘤细胞表达量差异基因的代谢通路打分后的差异热图,如下所示:
生信技能树
2024-05-31
1640
合并两个不同物种的单细胞转录组数据集注意harmony的参数
这两个数据集分别是人和鼠的SMC异质性探索的,文献标题是:《Single-Cell Genomics Reveals a Novel Cell State During Smooth Muscle Cell Phenotypic Switching and Potential Therapeutic Targets for Atherosclerosis in Mouse and Human》,可以看到GSE155513和GSE155512这两个单细胞转录组表达量矩阵是可以很好的整合:
生信技能树
2024-05-30
1870
多元化展示基因列表和其对应的具体基因的关系
看到了一个生物信息学数据挖掘,标题是:《Novel ferroptosis gene biomarkers and immune infiltration profiles in diabetic kidney disease via bioinformatics》,通过大量的数据分析拿到了11个FRDEGs基因列表,然后去对这11个基因进行“屎上雕花”,它们分别是: (ALOX5, CCL5, FHL2, G0S2,IGKC,KRT19,LCN2,LTF,PRKCB,RRM2,TUBA1A) ,比如下面的go数据库的注释结果,就使用了4种展示策略 :
生信技能树
2024-05-27
870
在本来就不应该存在某单细胞亚群的实验中发现了它?
但是如果我们回顾一下2024年1月的文章:《Unveiling inflammatory and prehypertrophic cell populations as key contributors to knee cartilage degeneration in osteoarthritis using multi-omics data integration》,它对应的数据集是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE255460 ,详细的解读见:样品分组都弄错了,数据分析结论还可靠吗。同样的第一层次降维聚类分群可以看到这里面是有免疫细胞和间质细胞的:
生信技能树
2024-05-17
1200
公共数据库验证出来了就是对的吗
可以看到,作者的第一层次降维聚类分群里面定义的非目标单细胞亚群占比非常少,主要是t细胞的混入。作者非常机智地指出来了这一点,非常棒。但是呢,这个时候作者给他们的3个b细胞亚群定义就很奇怪,不走寻常路啊:
生信技能树
2024-05-17
1450
如何让你的kegg注释结果图分门别类
KEGG数据库是一个综合性的生物信息数据库,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。它整合了基因组、化学和系统功能信息,旨在从分子水平上理解生物系统的高级功能和实用程序,特别是细胞、生物体和生态系统的功能。
生信技能树
2024-05-09
2740
难道铁死亡数据库记录的基因都是人类未知基因吗
只需要打开任意就近的GTF(Gene Transfer Format)文件即可,它是一种广泛使用的基因组注释文件格式,它详细描述了基因组中的各种基因特征。在GTF文件中,每一行代表一个基因组特征,并且通常会包含该特征的类型(gene_type)、位置、分数、链、相位以及属性等信息。属性字段(通常在第九列)可以包含多种不同的标签,其中就包括了gene_type,它描述了基因的具体类型。我们简单的统计如下所示:
生信技能树
2024-04-26
1790
单细胞亚群的生物学命名的4个规则
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。
生信技能树
2024-04-13
5110
基于Seurat的TransferData函数自动化迁移单细胞转录组亚群的注释信息
这个GSE206528的单细胞转录组数据集,很容易构建成为Seurat对象。仍然是走常规的单细胞转录组降维聚类分群代码,可以看 链接: https://pan.baidu.com/s/1bIBG9RciAzDhkTKKA7hEfQ?pwd=y4eh ,基本上大家只需要读入表达量矩阵文件到r里面就可以使用Seurat包做全部的流程。批量读取它的9个文件的代码如下所示:
生信技能树
2024-04-13
2490
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
生信技能树
2024-04-13
7790
CROST——空间转录组学的综合数据库
文章:Wang, G., Wu, S., Xiong, Z., Qu, H., Fang, X., & Bao, Y. (2024). CROST: a comprehensive repository of spatial transcriptomics. Nucleic Acids Research, 52(D1), D882-D890. https://academic.oup.com/nar/article/52/D1/D882/7288834
生信技能树
2024-04-13
2610
DiSignAtlas——基于bulk和单细胞转录组的人与小鼠疾病特征数据库
文章:Zhai, Z., Lin, Z., Meng, X., Zheng, X., Du, Y., Li, Z., ... & Pan, J. (2024). DiSignAtlas: an atlas of human and mouse disease signatures based on bulk and single-cell transcriptomics. Nucleic Acids Research, 52(D1), D1236-D1245. https://academic.oup.com/nar/article/52/D1/D1236/7335757
生信技能树
2024-04-13
2030
批量下载geo上面的单细胞表达量矩阵
其中,GSEXXXXXX 是该数据集的 accession number,是一个唯一标识符,用于在 GEO 数据库中检索该数据集的信息。可以通过构建类似这样的 URL,将 accession number 替换为任意感兴趣的 GSE 数据集的 accession number,以访问该数据集的主页。然后,就可以从主页中获取数据集的相关信息,包括表达量矩阵文件的下载链接等。
生信技能树
2024-03-29
4080
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档