首页
学习
活动
专区
工具
TVP
发布

生信技能树

专栏作者
1918
文章
3631105
阅读量
1134
订阅数
wget小细节(geo数据 ,figshare数据)
数据在CNGBdb,https://db.cngb.org/search/project/CNP0002454/
生信技能树
2023-03-01
2.1K0
学徒抽丝剥茧想搞清楚这个转录组数据问题出在哪里
这个CNP0002454数据集来源的文章:Identification of a 3-Gene Model as Prognostic Biomarker in Patients With Gastric Cancer ,大家可以自行阅读
生信技能树
2023-02-27
3530
gget,一个能高效进行各式各样网络数据库查询的工具
希望所有的学徒,实习生以及马拉松授课学员都可以在咱们《生信技能树》的舞台上大放异彩。前面有粉丝自告奋勇希望可以把他自己在简书等平台的生物信息学笔记分享在我们《生信技能树》公众号,在专业的舞台上跟大家切磋!非常欢迎,他前面的分享是:
生信技能树
2022-06-27
1.2K0
不同物种的的10x单细胞转录组参考数据文件构建
10x单细胞转录组数据分析所需要的参考数据文件主要是基因组的fasta文件和基因注释gtf文件,其官网有详细的例子:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr
生信技能树
2022-03-03
9430
上传数据到GEO数据库获得GEO号
我自己的笔记主要是参考官方文档:Submitting high-throughput sequence data to GEOHow to upload files to GEO以及我师兄给我写的教程
生信技能树
2022-01-10
1.8K0
纯数据挖掘之仔猪的长非编码RNA的鉴定
文章链接:https://doi.org/10.3389/fgene.2019.00196
生信技能树
2021-07-06
4210
lncRNA组装流程的软件介绍之aspera
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程! 下面是100个lncRNA组装流程的软件的笔记教程 Aspera是IBM公司的一款高速传输软件,创造了新一代的传输技术(faspTM),并能不受文件大小、形态、传输距离、网络条件限制,以最高效的速度来协助用户迁移各地的数据。使用 fasp传输专利技术,充分利用现有的 WAN 基础设施和通用硬件,传输速度比 FTP 和 HTTP 快达数百倍
生信技能树
2021-07-06
6260
能重复出来图表,却不知自己正确与否?
前面我布置了一系列学徒作业, 终于开始陆陆续续收到答案啦!下面的教程来自于7月的数据挖掘学员,对应的题目是:仅提供bam文件的RNA-seq项目重新分析
生信技能树
2020-11-03
1.1K1
根据CCDS数据库信息拿到全部外显子坐标
也就是说我三五年前写的很多教程需要更新了,那个时候使用的还是 CCDS.20161208.txt 这样的文件,在文章可以看到CCDS数据库的一些最新动态:
生信技能树
2020-10-26
2.1K0
使用bedtools根据染色体上的起止位置拿到基因symbol
bed格式文件至少包括前3列,分别是:染色体的名字、染色体上的起始位置、染色体上的终止位置。这一步无论用写字板、excel、R等进行处理都可以,文件的后缀名也不重要,因为强行将文件后缀改为bed时,在后面的Linux系统中进行bedtools处理时也会报错。所需的bed格式文件参见下图。
生信技能树
2020-06-11
10.4K0
北京基因组所数据库介绍(类似sra和ebi)
基因组学在生物学科的发展中,具有划时代的意义。同时,很多人在刚进入生物信息学领域时,最先接触的也往往是组装基因组,注释基因组。这在我们生信技能树的公号里有详细的教程,需要者可去公号get资源。前面jimmy老师介绍了sra和ebi这两个高通量测序数据存放中心:
生信技能树
2020-05-25
1.5K0
解读SRA数据库规律一文就够
一般的文章里面会给出数据地址,如下:根据文章的GSE号进入GEO数据库里面,就可以看到其对应的SRA数据库ID号。
生信技能树
2020-05-25
3.3K0
下载GEO数据太慢?快用axel
以下笔记分享来自于2019-11月学徒,其实去年也分享过一个类似的下载神器:GEO和GitHub下载神器
生信技能树
2020-02-24
4.6K0
使用aspera从EBI下载fastq数据,抛弃NCBI的SRA数据库吧!
ENA主页:https://www.ebi.ac.uk/ena/browser/home
生信技能树
2020-02-20
8.9K3
甲基化芯片数据下载的多种技巧
前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。(PS:如果这两个你没有阅读,本文后面的也不要看了,谢谢,请脱粉,我们不需要你)
生信技能树
2020-02-20
2.2K0
猪狗的参考基因组构建索引
比如搜索dog的:Canis lupus familiaris - Ensembl genome browser 98 就拿到了家犬的参考基因组,实际上狗这个物种本身非常复杂,丰富多彩!如果你看到不同品种的狗狗寿命排行榜,你会奔溃:
生信技能树
2020-02-13
1.1K0
不止是NCBI的SRA可以下载测序数据
最近要开一个肿瘤外显子实战线下课程,想到了以前看到的发在 Proc Natl Acad Sci U S A. 2015 Nov的文章Extremely high genetic diversity in a single tumor points to prevalence of non-Darwinian cell evolution , 研究者对一个肿瘤 hepatocellular carcinoma (HCC) 样品测序超过300个部位,其中23个进行WES测序。但是研究者把数据上传到了GSA (Genome Sequence Archive),如下:
生信技能树
2019-08-22
2.2K0
一个MeDIP-seq实战(优秀学徒成果展)
参考: http://www.bio-info-trainee.com/2352.html http://www.bio-info-trainee.com/2494.html
生信技能树
2018-10-25
1.9K0
用wget下载需要用户名和密码认证的网站或者ftp服务器文件
虽然我以前经常写爬虫,但毕竟是代码活,复用性非常低,每次得耗十几分钟解析网页并且写好代码。而熟悉linux的朋友都应该了解wget这个神器,有了url之后一行命令即可完成下载。 但真实的需求往往是,需要下载某个ftp服务器里面的多个文件,甚至该ftp服务器需要用户名和密码登录,比如公司给你提供的测序数据结果: Host: sftp.biotrainee.com.cn or 123.123.123.123Username: 80-78395743Password: 8L5973452TJ0t4tQMPort:
生信技能树
2018-03-09
11.6K0
比对NR库看看物种分布【直播】我的基因组88
前面我提前了我的基因组测序数据里面的未成功比对到人类基因组上面的那些fastq序列,也用了软件把它们组装成fasta序列,这些序列的功能是未知的,可以通过比对到NCBI的NT/NR库来给他们注释一下。 NR库是Non-redundant protein sequences from GenPept, Swissprot, PIR, PDF, PDB, and NCBI RefSeq,得去ftp://ftp.ncbi.nih.gov/blast/db/ 下载所有gz结尾的文件,并且解压到同一个目录即可。 最终
生信技能树
2018-03-09
2.6K1
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档