首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

MIMIC数据库提取教程-提取某种疾病下的实验室指标

我们在进行数据分析时,很多时候需要提取出患某种疾病的患者的实验室指标,比如患者的血气,血常规等指标。小编今天以提取患“肺栓塞”患者的实验室指标为例子,教大家如何提取mimiciv数据库的实验室指标。...01提取指标小编本次要提取的指标是患有“肺栓塞”的患者的以下实验室指标:“血红蛋白”,“D二聚体”,“葡萄糖”。...提取的最终结果如下:02操作步骤第一步,因为mimic中的疾病数据是根据icd编码查找的,所以我们需要先找出“肺栓塞”对应的icd编码,从下表可以看出肺栓塞的icd编码大部分都是以“415“开头的第二步...查找实验室指标的信息,并根据患者分组03合并结果小编现在已经分别查询出来了患了“肺栓塞”的病人,以及对应的实验室指标,最后需要把这些SQL语句合并后,才能输出在一张表格,其中使用了with子查询,分别把诊断数据跟实验室指标数据作为子查询

51870

从NT_NR数据库提取子库

1 首先下载NCBI的taxonomy数据库 下载完解压缩,其中names.dmp和nodes.dmp两个文件很重要,是后续提取子库的基础 2 下载NCBI的TaxonKit软件,http://bioinf.shenwei.me...3 下载NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux系统也是直接解压,即可使用 4 (选择性步骤)NCBI taxonomy数据库下还有...accession2taxid库,这个库里面也有蛋白以及核酸的accession以及对应的分类id,但是经过尝试,采取这种方法提取的子库序列往往出乎意料的少,很可能是该库的accession与NT/NR...库的accession不一致,前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库中的nucl_wgs.accession2taxid提取accession号...nt序列,并提取子库序列 blastdbcmd -db $NT -dbtype nucl -entry all -outfmt "%f" -out - | pigz -c > nt.fa.gz time

1.3K31

从NT_NR数据库提取子库

那么就有一个问题,如何选择去除污染的数据库呢? 思来想去,还是从NT库入手,打算把NT库所有动物的序列或者所有小鼠的序列提取出来,做成一个子库,用来去除宿主污染。...百度了一下提取子库的方法,大多都是人云亦云,干脆还是自己整理整理。...下面是一些步骤 1 首先下载NCBI的taxonomy数据库 下载完解压缩,其中names.dmp和nodes.dmp两个文件很重要,是后续提取子库的基础 2下载NCBI的TaxonKit软件,http...taxonkit 3下载NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux系统也是直接解压,即可使用 4 (选择性步骤)NCBI taxonomy数据库下还有...库的accession不一致,前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库中的nucl_wgs.accession2taxid提取accession号

56540

数据提取-JsonPath

JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。...适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不相上下。 Python 中自带了JSON模块,直接import json就可以使用了。...JSON json简单说就是javascript中的对象和数组,所以这两种结构就是对象和数组两种结构,通过这两种结构可以表示各种复杂的结构 对象:对象在js中表示为{ }括起来的内容,数据结构为 { key...的键值对的结构,在面向对象的语言中,key为对象的属性,value为对应的属性值,所以很容易理解,取值方法为 对象.key 获取属性值,这个属性值的类型可以是数字、字符串、数组、对象这几种 数组:数组在js...中是中括号[ ]括起来的内容,数据结构为 ["Python", "javascript", "C++", ...]

1.1K20

GEO数据库表达数据提取以及limma包进行差异分析

关于GEO数据库认识和在线使用教程,参考文章:GEO数据库使用教程及在线数据分析工具。...关于GEO数据库的R包:Bioconductor:GEOquery包,我们前面已经介绍,当然是官方案例,我们这里实战一下。...assayData 中就一个表达数据,我们可以提取出来。...好了,我们提取数据后,就可以进行后续的分析了,比如差异分析、表达谱热图绘制了。但差异分析是不是还要分组,所以我们还得知道每个GSM是那一组,比如对照和实验组。 我们提取表型数据。...如果我们获得的数据是原始的Counts数,可以利用edgeR包和DESeq2包进行差异分析,可以参考我在TCGA数据库差异分析的文章,在哪里,我也说过,尽管那是TCGA数据库的教程,但仅仅是提取表达数据的方法不同

16.8K911

MIMIC数据库提取教程-提取某种疾病下的患者人口统计学指标

在上一篇数据库提取教程中,小编教大家提取了“肺栓塞”患者的实验室指标,具体步骤可以参考MIMIC数据库提取教程-提取某种疾病下的实验室指标。...在本期数据库提取教程,小编依旧以“肺栓塞”患者为例,教大家如何提取患者的人口统计学指标。 在mimiciv数据库中,患者的人口统计学信息主要分为两部分。...本期小编就教大家如何在mimiciv数据库中获取患者的“年龄”,“身高”,“体重”这几个很重要的指标。...ad, patients pa WHERE ad.subject_id = pa.subject_id GROUP BY ad.subject_id 二,获取患者的身高 mimiciv数据库中患者的身高数据存放在...身高测试使用的是英寸,226730使用的是厘米 AND c.itemid in(226707,226730) GROUP BY c.subject_id) 三,获取患者的体重 mimiciv数据库中患者的体重数据也存放在

32920
领券