首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

HiC数据分析实战(一)

首先需要明白数据分析流程,可以查看第一讲:三维基因组学习笔记,提炼流程如下: Hi-C标准分析流程(比对及过滤,原始互作图谱构建) 下载参考基因组及构建bowtie2索引 把fq测序数据比对都参考基因组...过滤及挑选符合要求的比对结果 原始互作图谱构建 互作图谱迭代校正 Compartment分析 TAD分析 显著互作Loops分析 实战数据 来自于Tung B....其中特别值得推荐,可以处理各种各样的hic数据,包括: Hi-C in situ Hi-C DNase Hi-C Micro-C capture-C capture Hi-C HiChip 安装hiclib...Hic-pro教程 其说明书完全不逊于hiclib,详见:http://nservant.github.io/HiC-Pro 大体上看就6个步骤,比对、过滤HiC比对结果、检测有效HiC序列、结果合并、...其它实战数据集 上面的是细菌基因组,测序文件也小很多,适合练手,如果熟练了也可以找其它数据集,比如Rose基因组的HiC原始数据下载地址: http://sra-download.ncbi.nlm.nih.gov

6.3K52

HiC数据分析实战之通过文章来了解流程

本来准备直接实战了,但是在看一些新的paper 时候发现我漏掉了hic技术应用的文章解读,我还是需要带领大家看看那些已经发表的好文章到底是如何处理hic数据的。...GSE87585 北大李程课题组的研究人员比较了骨髓瘤细胞与正常B细胞之间的TAD的差异,在GM12878,RPMI8226与U266三个细胞系中,其分别得到了2756,3457,3342个TAD,其中有...虽然本次我们讲解HiC,但事实上这个文章利用的各种数据比较多,包括: ?...我们关心的HiC数据 主要是4个HiC样本,如下: GSM2334835: Hi-C U266 MboI; Homo sapiens; OTHER GSM2334834: Hi-C U266 HindIII...数据量不小,想下载全部的4个hic样本来完全重复出来该文章的分析过程及结果对服务器计算资源的考验很大, 其分析结果包括: ?

2.6K20

植物的单细胞数据如何过滤线粒体基因

曾老师有一篇文章《猪的单细胞分析如何过滤线粒体基因》[1],其中介绍了猪的单细胞数据分析应该如何过滤线粒体基因,本期我们参考此文章来看看植物的单细胞数据分析如何过滤线粒体基因。...由于是植物的单细胞数据,不能像做人单细胞数据分析那样pattern = "^MT-"来去除线粒体的影响,起因是拟南芥的基因名没有特定的标记,因此我们得自己寻找基因列表。...,而是一个数据框,这会影响后续的%in%,而unlist()的作用就是将list数据变成字符串向量或者数字向量的形式。...过滤线粒体基因 添加线粒体信息 Seurat_object[["percent.mt"]] <- PercentageFeatureSet( Seurat_object, features =...MTgenes,) 可视化查看数据情况 如果有一些油滴里线粒体比例很高,而转录本很少,那可能是细胞已经破裂。

1.1K20

Juicer: HiC数据分析与辅助基因组组装

导读 本文主要对处理HiC数据的Juicer程序进行一个简短的介绍,并展示如何利用Juicer进行基因组组装中染色体挂载的第一步。 1....特点 只需一次单击,用户就能够处理terabase规模的Hi-C数据集 自动注释Loops和Domains Juicer是一款开源的程序 与多个集群操作系统和Amazon Web Services兼容...结果 Juicer运行完成后主要有以下两个目录: splits splits目录下存放的是中间结果,由于hi-C数据量很大,所以会将原始序列拆分成很多份,并行运算,加快速度。...aligned aligned目录下存放的是最终结果,包含了可以导入juicebox的后缀为hic的图谱文件, inter.hic和inter_30.hic, 30表示通过MAPQ > 30进行过滤之后的结果

1.6K20

「Workshop」第二十五期 HiC数据分析简介

Hic数据介绍及相关分析 1,什么是Hic数据? Hi-C是研究染色质三维结构的一种方法。...2,Hic数据的优势 通过Scaffold间的交互频率大小,可以对已组装的基因组序列进行纠错。 基因信息不再仅仅是contig片段,而是被划分至染色体上,成为染色体水平。...3,目前的处理流程 图片27.png 4,分析主要工具 目前针对Hi-c数据处理的工具主要是Hic-pro和juicer 5,juicer的安装及使用 juicer由两部分组成:从原始数据到创建Hi-C...构建原始测序数据所在目录,并下载相关数据(测试数据)可选择。文件夹名字必须是fastq。...文件互作矩阵提取 pre 非juicer数据转.hic文件 Arrowhead arrowhead [-c chromosome(s)] [-m matrix size] [-r resolution]

3.7K21

单细胞数据中到底应该如何处理线粒体基因

作者 | 周运来 什么是线粒体基因 线粒体是参与细胞凋亡启动和执行的主要细胞器之一。线粒体基因在大多数细胞中表达,其表达水平是细胞类型特异性的。也就是说这个也是和细胞类型及其状态有关系的。...凋亡细胞表达线粒体基因,并将这些转录产物输出到哺乳动物细胞的细胞质中。例如,当凋亡的细胞被放入正常的细胞悬液中,会检测到更多的线粒体基因。检测到的线粒体膜占总膜的百分比如图所示 ?...线粒体是参与细胞凋亡启动和执行的主要细胞器之一。细胞凋亡的过程依赖于一系列信号事件,包括线粒体基因表达的增加和半胱天冬酶的激活。...相比之下,含有50%活细胞的样本只显示线粒体基因表达略有增加(5-7%),这表明存活率确实与观察到的线粒体转录本数量相关。...被裂解的细胞或细胞膜被破坏的细胞释放它们的细胞质转录本,而线粒体转录本可能仍然保留在双膜结合的线粒体内。具有完整线粒体的裂解细胞可能被gems包裹,这也增加了检测到的线粒体转录片段的概率。

2.4K31

新物种基因组组装

对人和鼠科研项目来说,各种NGS测序数据分析起来都是有成熟的流程和工具,但是并不是使用的物种都是有参考基因组和注释文件的,走流程的前提就需要先测定自己研究的物种的基因组,组装起来。...比如最近有粉丝咨询肺吸虫(Paragonimus westermani)也称“卫氏并殖吸虫”的转录组数据分析,我就顺手查了一下,发现ensembl等数据库并没有它的参考基因组信息。...其中 2014 Aug 12. doi: 10.7717/peerj.484 发表了它的线粒体基因组,然后 January 2019, giy146, https://doi.org/10.1093/gigascience...测序数据如下: ? 测序策略 可以看到这个策略里面有pacbio,但是并没有10x和hic哈,属于比较简单的测序。 组装效果评价: ? 组装效果评价 可以看到,组装结果一般般吧。...没有10x和hic的基因组组装效果简直没法看。

66810

HiC-Pro:灵活的Hi-C数据处理软件

HiC-Pro是一款高效的Hi-C数据分析软件,提供了从原始数据到归一化之后的HI-C图谱构建的完整功能,运行效率高,用法简便。...红色方框标记的是数据预处理部分,功能和HICUP软件类似,包括序列比对和筛选valid pairs;预处理之后就是binning, 构建不同分辨率下的原始的交互矩阵contact map, 最后对原始的...HiC-Pro的一个强大功能在于可以构建单倍型级别的Hi-C图谱,单倍型级别的Hi-C图谱有助于更加精细化理解基因组三维结构,进一步对基因调控等功能进行深入细致的研究。...序列比对 HiC-Pro采用了两步比对的策略,如下所示 ?...HIC-Pro还提供了一系列的质控标准,如下图所示 ? 一个高质量的文库绝大部分肯定都能够比对上基因组,如图A所示, R1和R2的比对率都很高。

1.6K20

2万多行MyBatis源码中有多少设计模式|文末赠书

场景介绍:SqlSessionFactory 是获取会话的工厂,每次使用MyBatis 操作数据库时, 都会开启一个新的会话。...在会话工厂的实现中,SqlSessionFactory 负责获取数据源环境配置信息、构建事务工厂和创建操作SQL 的执行器,最终返回会话实现类。...MapperProxy 实现类, 代理工厂实现的功能就是完成DAO 接口的具体实现类的方法,配置的任何一个DAO 接口调用的CRUD 方法,都会被MapperProxy 接管,调用到方法执行器等,并返回最终的数据库执行结果...这个类在MyBatis 中使用得非常频繁,包括解析数据源配置信息并填充到数据源类上,同时参数的解析、对象的设置都会使用这个类。 同类场景:PropertyTokenizer。

40020

图解:数据结构中的6种「树」,大鹏问你心中有

数据结构这门课程是计算机相关专业的基础课,数据结构指的是数据在计算机中的存储、组织方式。...今天就带大家一起学习下,数据结构中的各种「树」,这也是面试中经常考察的内容,手撕二叉树是常规套路,对候选人也很有区分度,学完这篇文章,相信大家都会心中有「树」了。 ? 从树说起 什么是树?...二叉树 有了前面「树」的基础铺垫,二叉树是一种特殊的树,还记的上面我们学过「节点的度」?二叉树中每个节点的度不大于 2 ,即它的每个节点最多只有两个分支,通常称二叉树节点的左右两个分支为左右子树。...实际应用中有很多改进版的二叉查找树,目的是尽可能使得每个节点的深度不要过深,从而提高查询效率。比如AVL树和红黑树,可以将最坏效率降低至O(log n),下面我们就来看下这两种改进的二叉树。...❞ ❝有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,求频数最高的100个词 ❞ ❝1000万字符串,其中有些是重复的,需要把重复的全部去掉,保留没有重复的字符串

1.2K51

不同的调控程序控制伤口愈合过程中皮肤成纤维细胞的再生潜能

,ratinioc acid和Hic1控制间充质的再生能力结果 注意:①本文中不同课题组单细胞转录组的数据整合以及文中所做分析的详细代码。...自己单细胞数据也鉴定出HF 间质部分的Hic1表达以及Hic1基因的调控网络。 Hic1主要分布在lower dermis中,upper dermis很少。...Hic1+ 细胞共表达fibro-adipogenic MPs的marker如PDGFRa,SCA1(Ly6a),CD29 ? ? ? ① Hic1+细胞是hfDSC?...使用Hic1-tdT小鼠,短期谱系追踪。Hic1+细胞标记一部分的hfDSC。 ? ②毛囊外的Hic1+细胞会在毛发生长期增殖并提供新的真皮细胞? 会,而且是皮肤MP特有的。...与上文中的免疫荧光实验相一致,基于单细胞的数据,也就是marker表达,Hic1+细胞组成如下图,大部分是毛囊外的真皮细胞。小部分是HF细胞。 ?

1.1K11
领券