前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >这5个miRNA组成的肺鳞癌诊断基因集在tcga数据库能复现吗

这5个miRNA组成的肺鳞癌诊断基因集在tcga数据库能复现吗

作者头像
生信技能树
发布2020-05-06 17:49:02
9220
发布2020-05-06 17:49:02
举报
文章被收录于专栏:生信技能树

最近看到某公司宣传他们的科研服务产品,是miRNA的芯片,而且文章居然是2011发表的,那个时候我还不知道生信是啥子。(我一直以为自己足够老了)

该研究使用的是 CapitalBio 平台 (CapitalBio 公司) 芯片,非常清晰的研究思路;

  • 60+88个肺鳞癌病人肿瘤组织和癌旁的miRNA芯片表达矩阵,数据集在:GSE15008
  • 芯片是 CapitalBio 平台 (CapitalBio Corp.) ,包含 924 mature mam- malian microRNA probes (including 677 human micro- RNA sequences)(现在miRBase数据库收录了1917条pre-miRNA(前体),以及2656条成熟的miRNAs。见:http://www.mirbase.org/ )
  • 使用主成分分析和支持向量机建模,拿到 minimal 5- element classifier (hsa-miR-210, hsa-miR-182, hsa-miR- 486-5p, hsa-miR-30a, and hsa-miR-140-3p) 可以很好的区分normal和tumor。
  • 生存分析发现:high expression of hsa-miR-31 was associated with poor survival
  • 分析hsa-miR-31 的靶基因,并且实验验证其中3个:DICER1, PPP2R2A, and LATS2,最后定位到DICER1 30-UTR

我以前在在生信技能树分享了几个miRNA的靶向基因的查询工具,分别是:

大家可以尝试看看hsa-miR-31 的靶基因,是否有这3个基因,示意图如下:

miRNA靶向调控示意图

学徒作业

大家可以去tcga数据库下载肺鳞癌的miRNA芯片或者测序数据,走同样的诊断建模流程,看看得到的miRNA是否作者的5个miRNA有交叉。这里面变量很多:

  • 首先,两个队列的人群地域差异
  • 其次,miRNA芯片和miRNA测序技术差异
  • 还有,肿瘤组织和癌旁配对问题,两个组数据量问题

对大家来说,比较难的地方就是使用主成分分析和支持向量机建模。可以参考我的4个小时TCGA肿瘤数据库知识图谱视频教程,其中中共使用了四种算法构建模型:

不管用了那种算法,核心都只是几句代码而已。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 学徒作业
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档