首页
学习
活动
专区
工具
TVP
发布

生信了

专栏作者
117
文章
132202
阅读量
43
订阅数
基于 ggplot2 的 confusion matrix 可视化
confusion matrix 经常被用来表示两个类别重合的程度,比如在分类任务中,我们可以用 confusion matrix 来展示预测的 label 与真实的 label 在多大程度上是一致的。
一只羊
2022-11-30
8070
PaperR-(3)-2022-09
Automated reconstruction of whole-embryo cell lineages by learning from sparse annotations
一只羊
2022-11-30
3490
cython初体验
笔者最近参与了一个项目,其目的是提升一个python程序的运行速度。其中一个手段就是利用cython来优化原来的python代码。笔者之前没有接触过cython,所以这次属于在实践中学习新知识。
一只羊
2020-06-16
1.1K0
浅谈python中的多线程和多进程(二)
前文《浅谈python中的多线程和多进程》中我们分享过一个例子,就是分别利用python中的多线程和多进程来解决高运算量的任务,从中看出二者的一些区别。其中一点是“多线程会共享所属进程的内存资源;而子进程会从父进程那里拷贝一份内存资源”。当时没有进一步解释,为了更直观地了解这一点,本文给出一个例子。
一只羊
2020-06-04
6950
浅谈python中的多线程和多进程
我们在进行生信分析时经常要处理大文件,如果用串行运算往往费时,所以需要并行运算以节省时间。目前,流行的生信工具通常都可以并行运算,比如bwa。通常来讲,我们进行并行运算可以选择多线程或者多进程。那么二者有什么差别呢,我们又该如何选择呢?
一只羊
2020-04-07
7640
Python+selenium自动下载xml或exe文件
笔者最近在写一个小工具,需要从pubmed上批量下载包含文献信息的xml文件。很明显,这是一个爬虫任务,笔者选用了python+selenium的组合。代码写好后运行一切都很顺利,直到最后Chrome出现了警告信息,提示我是否要保留文件:
一只羊
2019-12-05
1.8K0
(转载)Python的configparser模块
做生信的同学在使用类Unix系统的时候,经常会接触配置文件(config)。就笔者自己的经验而言,配置文件的常见格式有如下几种:
一只羊
2019-10-18
3530
(转载)Python的logging模块
做系统运维的朋友一定对 log(日志)的重要性有深切体会。做生信的同学在搭建 pipeline 时也会注意对程序运行的状态做一些记录,尤其是错误信息。下面的语句相信很多朋友都很熟悉:
一只羊
2019-10-18
3380
Shell(一)好的操作习惯
前一段时间顺丰运维人员将生产数据库删除的传闻着实成为了新闻热词,如果传闻是真的,相信那位运维也是无心之过,可能只是一瞬的手误。但是代价太大了,业内人员都懂的。
一只羊
2019-07-27
4720
Shell(二)常用命令和技巧
Shell命令行一些常用命令 date cal calendar pwd parent working directory cd change directory ls list directory contents cp copy files and directories mv move and/or rename files and directories rm remove files touch create empty files or update file timestamps
一只羊
2019-07-27
3640
Python(一)让你的代码更加pythonic
pythonic就是让你的代码更加具有python特色,通常是利用python独有的一些语法实现的。pythonic的代码往往更加简洁、优美和高效,不信你接着往下瞧:
一只羊
2019-07-27
5550
生信(一)对BED文件进行排序
在处理NGS数据时,经常要对BED文件进行排序。假设BED文件长这样,分隔符是’\t’:
一只羊
2019-07-27
3.3K0
生信(二)反向互补序列
如何得到一段基因序列的反向互补序列?这是基因测序领域经常遇到的问题。其实答案很简单,许多现成的软件都有这个功能。但是作为一个生信人,当然可以自己实现一个了。
一只羊
2019-07-27
1.5K0
生信(四)命令行并行化工具GNU parallel
我们在日常工作中经常要“批量”处理一些任务,比如“批量”解压目录下的gz文件。当然,用shell写一个for循环是很简单就可以实现的,比如下面这样:
一只羊
2019-07-27
6120
生信(五)awk求取某一列的平均值
awk是生信人必须要掌握的命令行工具。为什么?因为它太强大了。我们举一个例子来说明。
一只羊
2019-07-27
2.1K0
算法(五)字典树算法快速查找单词前缀
字典树,又称单词查找树,是一个典型的一对多的字符串匹配算法。“一”指的是一个模式串,“多”指的是多个模板串。字典树经常被用来统计、排序和保存大量的字符串。它利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较。
一只羊
2019-07-27
2.2K0
C语言读取文件(二)fscanf 详谈
fscanf 函数与 scanf 函数用法类似,只不过前者用于读取文件流的数据而已。至于 fscanf 的基础用法我就不赘述了,网上的文章很多。简单提及一下要点:
一只羊
2019-07-27
5.5K0
使用Python去爬虫
爬虫,简单说就是规模化地采集网页信息,因为网络像一张网,而爬虫做的事就像一只蜘蛛在网上爬,所以爬虫英文名就是spider。
一只羊
2019-07-27
1.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档