首页
学习
活动
专区
工具
TVP
发布

生信技能树

专栏作者
1910
文章
3607654
阅读量
1134
订阅数
写代码我不如chatGPT
就是我服务器里面有上面的文本内容的第一列的这些文件,但是这些文件名字确实是有点难以理解;
生信技能树
2023-09-04
1430
Linux下的文本排序让我很意外
这里就是{1..25}语法,是shell的扩展,shell扩展有以下几种,并按以下顺序处理,当然如果没找到匹配的扩展格式,那就不处理:
生信技能树
2023-02-28
9020
单细胞基因组测序看拷贝数变异就足够了
我猜测主要是因为单细胞基因组测序的分析手段有点少,看拷贝数变异就足够了,比如发表于2022年6月份的nature的文章:《cGAS–STING drives the IL-6-dependent survival of chromosomally instable cancers》,里面就有 shallow single-cell whole-genome sequencing. 数据在 https://www.ebi.ac.uk/ena/browser/view/PRJEB49800 ,很容易下载里面的测序fastq数据:
生信技能树
2023-02-28
2600
输出人类全部基因的全名和别名
如果你通过数据分析拿到了一系列感兴趣的基因,但是只有类似于TP53这样的基因标准symbol名字,想批量拿到全部的基因的全名和别名,这里有一个代码分享给大家。
生信技能树
2023-02-28
4960
Hail-GWAS教程笔记
主要参考自:Hail | GWAS Tutorial[1]本笔记旨在提供Hail功能的概述,重点是操作和查询遗传数据集的功能。我们进行了全基因组SNP关联测试,并证明了需要控制由群体分层引起的混杂。
生信技能树
2023-02-27
5540
单个病人的完善的多组学研究
做完初出茅庐的临床科研小透明,也是可以细心留意遇到了病例,哪怕只有一个病人,也可以做完善的病人多组学研究。下面分享一个2022年6月发表在《Annals of Oncology》的文章:《Single cell heterogeneity and evolution of breast cancer bone metastasis and organoids reveals therapeutic targets for precision medicine》,DOI:https://doi.org/10.1016/j.annonc.2022.06.005 :
生信技能树
2022-07-26
4750
DNA突变频谱不应该是仅限于肿瘤somatic的SNV
而且对成百上千的somatic的SNV通常是需要去看突变频谱,比如2020的文章 :《Multiomics profiling of primary lung cancers and distant metastases reveals immunosuppression as a common characteristic of tumor cells with metastatic plasticity》 ,就是简单的做了分析,并且描述一下占比比较高的signature是什么,以及 它的生物学意义:
生信技能树
2022-07-26
2610
CPAT和CPC2软件安装报错的思考
一、CPAT和CPC2软件用于评估编码蛋白能力,一般在lncRNA分析中常用,生信技能树已经介绍过不再赘述。
生信技能树
2022-06-08
9940
TCGA癌症数据挖掘之预后模型建立和评价
表达矩阵只需要tumor数据,不要normal,将其去掉,新表达矩阵数据命名为exprSet;
生信技能树
2022-06-08
4.2K1
使用R包的内置数据不能通过两个冒号吗?
也就是说 pbcmc其实是想使用 genefu 包的内置数据pam50这个变量,我看了看,这个变量是存在的:
生信技能树
2022-04-14
7970
使用rvest从COSMIC中获取突变表格
在学习如何爬取网页之前,要了解网页本身的结构。 用于构建网页的主要语言为 HTML,CSS和Javascript。HTML为网页提供了其实际结构和内容。CSS为网页提供了其样式和外观,包括字体和颜色等细节。Javascript提供了网页功能。在此,我们将主要关注如何使用R包来读取构成网页的 HTML 。
生信技能树
2022-04-14
1.9K0
万字长文带你手把手完成一个单细胞转录组文献 图表复现(GSE123837)
数据来源[1]于细胞学万能老二的期刊《nature cell biology》的一篇文章《Transcriptional diversity and bioenergetic shift in human breast cancer metastasis revealed by single-cell RNA sequencing》[2],提到了乳腺癌转移过程中的mitochondrial oxidative phosphorylation (OXPHOS) 通路激活问题。
生信技能树
2022-03-03
1.1K0
上下调差异基因那么多!如何定位目标基因呢?
这里推荐一个新鲜出炉的文章给大家学习 :《CECR2 drives breast cancer metastasis by promoting NF-κB signaling and macrophage-mediated immune suppression》
生信技能树
2022-03-03
1.9K0
如何快速定位到你所干扰的基因的功能
前面我们分享了:上下调差异基因那么多!如何定位目标基因呢?,需要一些生物学背景才能从成百上千的上下调基因里面的“拿到”自己感兴趣的基因,去开启一个课题。该文章是:《CECR2 drives breast cancer metastasis by promoting NF-B signaling and macrophage-mediated immune suppression》
生信技能树
2022-03-03
3400
基于非负矩阵分解的单细胞降维聚类分群
可以看到,在CD4和CD8的T细胞的各自矩阵内部降维聚类分群,这6个细分亚群都并不是泾渭分明的界限。听完分享才知道,原来作者这个时候的细分亚群其实并不关心它们内部是不是有不同的独立的单细胞亚群,仅仅是有这6个不同状态或者说发挥不同功能单细胞亚群。而区分它们的手段是非负矩阵分解,并不需要有很清晰的界限,只需要各个亚群的核心功能基因集有差异即可。
生信技能树
2022-03-03
2.1K0
KEGG数据库的12大代谢通路分类
其实这样的KEGG数据库的12大代谢通路数据挖掘文章很多,其中一个佼佼者是复旦大学邵志敏团队三阴性乳腺癌的代谢组学文章,文献标题是:《Metabolic-Pathway-Based Subtyping of Triple- Negative Breast Cancer Reveals Potential Therapeutic Targets》,其数据挖掘仅仅是一个引子,后续仍然是有大量真实病人自己的代谢组数据做支撑。如下所示,可以看到在the tumor samples versus paired normal samples in the FUSCC cohort. 的差异分析里面,统计学显著(upregulated or downregulated (FDR < 0.05))的失调代谢通路,在 10 metabolic categories 分类展示 :
生信技能树
2022-03-03
6.6K0
上传数据到GEO数据库获得GEO号
我自己的笔记主要是参考官方文档:Submitting high-throughput sequence data to GEOHow to upload files to GEO以及我师兄给我写的教程
生信技能树
2022-01-10
1.8K0
为什么一定要是预后相关基因呢
标题其实很有意思,研究者得到的基因集是 Predictive but Not Prognostic Biomarker!
生信技能树
2021-12-27
4130
真的有人相信仅仅是两次差异分析的交集就能定位目标基因吗
肿瘤免疫微环境我们讲了很多内容了,主要是 ESTIMATE 算法和CIBERSORT算法 ,目录是:
生信技能树
2021-12-16
7090
肿瘤拷贝数变异的差异分析应该以这个肺癌脑转移为标准
粉丝的问题很朴素,就是想把TCGA数据库里面的非小细胞肺癌里面的肺鳞癌区分成为是否有TP53这个基因的somatic突变的两个分组,然后去比较这两个组别里面的病人的肿瘤拷贝数变异,做一个差异分析。
生信技能树
2021-12-10
5440
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档