lncRNA全称为long non-coding RNA, 长链非编码RNA, 指的是长度在200nt以上的非编码RNA。 lncRNA在细胞周期调控, 细胞分化调控,疾病的发生与发展等多种生命活动中发挥着重要作用,是研究的热点之一。
有多项研究表明lncRNA与众多生物学过程,复杂疾病相关,为了进一步探究lncRNA在这些生命活动中的具体作用,我们需要对lncRNA的功能进行分析。
首先对TCGA的RNA表达预处理,筛选掉其中的低表达基因(count<10)进行预处理。根据GENCODE Release 29(GRCh38.p12)(https://www.gencodegenes.org/human/)注释mRNA和lncRNA。 而miRNA是基于miRbase v22数据库(http://www.mirbase.org/index.shtml#opennewwindow)进行注释。
我在查找免疫相关lncRNA时发现了一个专门的网站:ImmReg: http://bio-bigdata.hrbmu.edu.cn/ImmReg/index.jsp
lncRNA(long non coding RNA)发挥功能的方式,目前研究最多的还是ceRNA 的功能。经典的ceRNA调控网络是通过 lncRNA-miRNA-mRNA 来构建的。这个研究思路,相对来说已经很成熟了,如果要在这个方面研究的话,其实再加一些变化可能更好一些,毕竟成熟的思路就代表创新性少一些,而如果要加变化的话,由于 ceRNA 调控的原始还是序列的结合,所以最直接能加的还是看基因组变异对于ceRNA 调控的影响。所以这次给大家推荐一个基因组变异对于ceRNA调控影响的数据库:LnCeVar
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程! 下面是100个lncRNA组装流程的软件的笔记教程 在高通量测序分析中用于下游分析的关键信息是比对到每个genomic feature(外显子、基因等)中的read数目,而计数的过程称为read summarization featurecounts是一款使用于RNA-seq和DNA-seq的read summarization工具,应用
做科研的友友们可能都知道,长链非编码RNA(lncRNA)与人类疾病相关这个事实。虽然lncRNA与疾病的关联已受到广泛关注,但目前缺乏数据库预测lncRNA介导的靶基因调控机制、关键下游靶基因以及与疾病相关的lncRNA的重要生物学功能。那么,今天的神器就是为了解决这些问题的!
又是一篇signature的文章,不过文章重点不在是mRNA了,而是我们的科研热点lncRNA。
lncRNASNP数据库收集整理了人和小鼠中位于lncRNA基因上的SNP位点信息,通过以下两种思路将lncRNA与SNP结合起来
HCMDB(人类癌症转移数据库)是一个集成数据库,可以存储和分析癌症转移的大规模表达数据。该数据库从GEO和TCGA中收集了124个先前公开的转录组数据集,用于比较转录组以检查转移相关基因的表达,在目前版本的HCMDB中,它包含来自四百多个实验的29种癌症类型。为了注释那些可能与转移相关的基因,数据库基于7,000多种已发表的文献,总共筛选了2183个基因(1901个蛋白质编码基因,24个长非编码RNA和203个miRNA)。
TANRIC整合了来自TCGA, CCLE等大型肿瘤研究项目的数据,对多种肿瘤的lncRNA表达量进行分析,差异分析,并对lncRNA与临床信息,基因组等数据进行相关性分析,文章发表在Cancer Research上,链接如下
随着lncRNA研究的发展,lncRNA的数量越来越多,但是拥有功能注释的lncRNA只占了其中很小一部分。为了更好的开展lncRNA的功能研究,科学家收集文献中人类lncRNA相关的数据,包括了表达量,相关疾病,甲基化位点,SNP位点,功能描述等信息,并整理成了数据库LncBook, 网址如下
大家应该是都知道,TCGA数据库是目前最综合最全面的癌症病人相关组学数据库,包括:
机构:中国农业大学动物科学技术学院,农业部动物遗传繁育重点实验室,动物繁育国家工程实验室
ceRNA是近年来研究的非常火热的一种调控机制,指的是不同RNA分子竞争性的结合miRNA, 通过这种竞争关系来调控不同RNA的表达,这里的RNA分子可以是mRNA, lncRNA, 甚至是pseudogene。
在过去几年里,研究发现long non-coding RNAs (lncRNAs)在疾病和生物调控过程中扮演着重要角色。但在大量非模式物种中lncRNA的鉴定仍是一项富有挑战性的工作。该工作需要确定的序列信息,注释信息以及构建物种特有的训练集,但具有lncRNA研究所需的足够完整的序列与注释的物种只占很少数。
不过对于其它物种,猫狗猪,甚至其它你叫不出来名字的昆虫,鱼类,这个分析策略还是蛮常见的。比如发表在Front. Genet., 18 March 2019 | https://doi.org/10.3389/fgene.2019.00196的文章
网络正朝向基于软件的系统迅速发展,提供自动配置、改进的管理与安全性,以更好地支持DevOps风格的应用程序开发。软件网络(软件定义网络和网络功能虚拟化)的自动化优势对于支持采用新IT与网络架构(包括混合云和物联网)至关重要。 传统上,网络是用特定功能优化的基于硬件的平台所构建。这些盒子包括路由器、以太网交换机、Wi-Fi控制器、服务器负载平衡器和网络安全设备,如防火墙与入侵检测系统。网络硬件通常运行复杂的分布式控制软件,所有这些都具有独立的配置和管理系统。配置和管理要求因网络类型和网络位置而异。配置和修
Lnc2Cancer[1](http://www.bio-bigdata.net/lnc2cancer/index.html)收录了lncRNA或circRNA与人类癌症之间全面的实验支持关联。在以前的版本相比,当前的3.0版本已收录通过审查的1,5000多篇已发表的论文,包含10,346个条目,2,775个人类lncRNA,743个circRNA和226种癌症亚型相关的lncRNA-癌症关联。新增加了约1,049个实验支持的circRNA-癌症关联与743个circRNA和70种人类癌症亚型。以及新增了与实验证明的癌症相关lncRNA和circRNA的调控机制部分,以及一个单细胞分析平台,用于探索癌症相关的lncRNA。同时提供了实验支持的包括microRNA、转录因子、突变、甲基化和增强子在内的分子调节机制,多种生物学功能(如细胞生长、凋亡、自噬、上皮间质转化、免疫和编码能力)和转移、复发、耐药性以及预后等临床应用。主页我们可以在搜索栏中输入lncRNA、circRNA和cancer进行快速检索,并通过下图红框中的条目快速浏览lncRNA和circRNA的调节机制,功能和临床应用。
这一次要分享的文章题目是:Five key lncRNAs considered as prognostic targets for predicting pancreatic ductal adenocarcinoma
同样的策略,我们也可以应用到lncRNA的学习。以前我在:miRNA、LncRNA、CircRNA靠谱小结 也提到过一些基础知识,但还不够丰满!其实读一篇综述是最好的学习方式,不过英文的毕竟难啃。假如你还是需要深入学习,建议看2009的CELL杂志的超级经典综述:Evolution and Functions of Long Noncoding RNAs
对于预测到的lncRNA序列,通过Repeatmasker软件分析其中的重复元件。所有预测的lncRNA, 又分为以下两类
step1: 计算资源的准备 如果有差不多配置的服务器,就可以从SRA/FASTQ格式数据开始走全套流程。不懂配置,请看前面转录组和表观组的传送门。 如果只有个人电脑,那么直接下载表达矩阵开始分析也是可以的。 step2: 读文献,查看GEO数据 文章是 Annotation and cluster analysis of spatiotemporal- and sex-related lncRNA expression in Rhesus macaque brain , 作者测了 4个年龄段的恒河猴:1年
DNA甲基化作为研究的最为广泛的一种表观遗传标记,其对基因表达的影响是研究的基本内容。随着lncRNA研究的发展,科学家将眼光放到了位于lncRNA基因上的DNA甲基化位点,通过lncRNA基因上的甲基化位点来找到疾病相关的lncRNA, 并探究lncRNA在疾病中的作用。
CryptBot 最早在 2019 年被发现,近期再次爆发。最新版本的 CryptBot 已经显著简化,只包含信息窃取的功能,样本大小相比以前小得多。
摘要:耗牛被誉为“高原之船”,经过几千年的进化和低氧强紫外线的残酷环境选择,适应了高原环境,为青藏高原人民提供了重要的物资。本研究旨在寻找牦牛高原适应过程中差异表达(DE)基因和新的长非编码RNA(LncRNAs)及其潜在的共表达调控网络。
让我很无语,我又不是带领本科生搞一个学期的课程,仅仅是不到2小时我能讲解什么背景呢:
Ubuntu官方中文译名为友帮拓,是一款开源免费的linux操作系统。与其他的linux操作系统不同之处在于Ubuntu的软件包清单只包含那些高质量的重要应用程序,因此深受广大linux用户的喜爱,那么ubuntu怎样安装呢?下面就跟小编一起来看看怎么用u盘安装ubuntu系统(因为现在很多的台式电脑已经没有光驱了)。 工具/原料 U盘,ubuntu操作系统的iso文件,UltraISO软件。 安装步骤 首先我们要来下载Ubuntu操作系统,操作系统的下载可以到Ubuntu的中文官方网站进行下
CPC2为CPC 的升级版,发布于2017 年,是目前最新的lncRNA 鉴定工具,也代表着lncRNA 鉴定的最新研究进展。在经过大量的特征选择后,CPC2 最终的特征主要包括四条:最长ORF 长度,ORF 的完整性,Fickett 分数以及等电点 (isoelectric point, pI)[39,40]。其中等电点特征主要是通过将最长ORF 翻译为氨基酸序列,而后根据氨基酸等电点这一理化性质计算而得。与大多lncRNA 鉴定工具相同,CPC2 也使用了支持向量机来构建分类器。
lncRNA 的全称是long noncoding RNA。即又长又表达且还不能编码翻译成蛋白质的一类RNA。
只需要输入转录本对应的fasta格式的文件就可以了,输出文件output内容示意如下
百味科研芝士的小伙伴们大家好啊!好久不见甚是想念,点赞在看养成习惯。我是你们的老朋友小木舟~今天给大家分享来自《Epigenomics》,IF= 4.173,国人占比:4.80% 的一篇文章。文章的题目是:新型mRNA-miRNA-lncRNA竞争内源性RNA网络的鉴定与乳腺癌的预后相关。简单的说就是乳腺癌的ceRNA网络构建。
NONCODE数据库是一个综合的非编码RNA数据库,该数据库中包含了除tRNA和rRNA之外的其他类型的非编码RNA信息,其中绝大部分是lncRNA,网址如下
据Bleeping Computer网站8月23日消息,网络安全研究人员发现了多个恶意软件传播活动,目标针对下载盗版软件的互联网用户。 该活动使用 SEO 投毒和恶意广告推高这些“带毒”的共享软件网站在 Google 搜索结果中的排名,据发现此事件的Zscaler 称,这些盗版软件包括了3DMark、Adobe Acrobat Pro等时下热门应用。多数情况下,这些软件安装程序的恶意可执行文件位于文件托管服务上,因此登陆页面将受害者重定向到其他服务以下载这些文件。 【含恶意盗版软件的高排名搜索结果】 【
lncRNome是一个综合性的人类lncRNA数据库,中收录了超过17000个lncRNA,网址如下
前两期周更我们通过一篇文章的复现整理了mRNA和lncRNA分析基本流程,但并没有涉及新lncRNA的鉴定,本周的推文本质上是我个人学习鉴定lncRNA的全套流程笔记,整合了我们公众号往期的资源,对代码进行了勘误更新,内容非常详实。
作为一名科研狗,重来,是研究生,想来最重要的就是课题能否顺利的进行,当满心欢喜的搞好了实验设计发给老板,一天不到就被打回来,内心那是满满的崩溃
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
只想用生信分析注释个基因,找找lncRNA,做个火山图图来展示结果,还不想学习写代码,怎么办?
标题:The landscape of lncRNAs in Cydia pomonella provides insights into their signatures and potential roles in transcriptional regulation
lncRNA在生命活动中发挥重要作用,不仅在哺乳动物中广泛存在,在植物中也是存在的,目前植物中的lncRNA研究相对动物而言较少,只有水稻,杨树,苜蓿,棉花等几个物种有相关报导。
标题:Identification of long non-coding RNA in the horse transcriptome
LncFinder是一种新的lncRNA识别工具。基于六聚体的对数距离,多尺度结构信息和从快速离散傅立叶变换获得的理化特征。为了确定最佳分类器,使用10倍交叉验证对五种广泛使用的机器学习算法进行了验证:逻辑回归,支持向量机(SVM),随机森林,极限学习机器和深度学习。最终选择SVM作为LncFinder的分类器。经过全面的功能选择和模型验证方案的评估,LncFinder在多个物种上的表现优于几种最先进的工具。用户可以轻松,高效地使用新的数据集或不同的机器学习算法对LncFinder进行重新训练。
细胞焦亡在胃癌的进展中起着至关重要的作用,并影响胃癌的预后。然而,细胞焦亡相关lncRNA在预测胃癌预后方面的重要性尚不清楚。
Hisat是一种高效的RNA-seq实验比对工具。它使用了基于BWT和Ferragina-manzini (Fm) index 两种算法的索引框架。使用了两类索引去比对,一类是全基因组范围的FM索引来锚定每一个比对,另一类是大量的局部索引对这些比对做快速的扩展。比对原理可阅读文献原文:HISAT: a fast spliced aligner with low memory requirements.
https://www.better365.cn 这是一家专注于开发 Mac 软件的公司,他们家的很多产品都比较实用,非常优秀
可以直接输入fasta格式的序列,也可以输入bed格式的文件,此时需要指定对应的基因组版本,示意如下:
(HNSCC)从Cancer Genome Atlas下载(TCGA)数据库(https://gdc-portal.nci.nih.gov/)。根据口腔的解剖学定义,387个口腔样本(336个OSCC样品和51个正常对照样品) 从587个HNSCC数据中提取。 mRNA和miRNA表达数据包括327个OSCC样本和31个非癌样本已下载。原始lncRNAs和mRNAs 数据(HUGO基因命名委员会(HGNC)数据库 (http://www.genenames.org/)包含2775个lncRNA和19004他们的靶mRNA。
标题:转录组分析鉴定 到新的3-lncRNA关于 糖尿病视网膜病中 转甲状腺素 减弱葡萄糖诱导人视网膜内皮细胞功能障碍 的调控网络
最近在做一个0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》,直播活动,收集整理文献看到了一个很有意思的研究,节选文章里面的部分图表作为学徒作业哈!
领取专属 10元无门槛券
手把手带您无忧上云