生信小驿站

206 篇文章
39 人订阅

Python

用户1359560

Python从零开始第三章数据处理与分析python.query()函数

=============================================== 本文主要介绍使用python.query()函数对数据框进行(...

2882
用户1359560

两行python代码识别图片上文字

Tesseract 是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与...

1207
用户1359560

Anaconda介绍与Ubuntu/windows安装Anaconda

大多数 Python 的初学者们都曾为配置环境问题或者选择便利的编辑器等问题头疼,所以这里推荐使用 Anaconda 来管理你的安装环境和各种工具包。

1522
用户1359560

社交网络分析(Social Network Analysis in Python)①

首先让我们从社交网络的含义开始。 下面你会看到一个宝莱坞演员网络作为节点。 如果他们在至少一部电影中合作,他们就会用实线连接。所以,我们可以看到Amitabh ...

1712
用户1359560

Python从零开始第五章生物信息学④kegg查询续

通过这里可以输出kegg的通路信息,包括通路里面的基因,基因间的联系方式,以及链接等等。

882
用户1359560

Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)

在第一部分中,我们将通过示例介绍如何读取CSV文件,如何从CSV读取特定列,如何读取多个CSV文件以及将它们组合到一个数据帧,以及最后如何转换数据 根据特定的数...

782
用户1359560

Python数据处理从零开始----第二章(pandas)⑨pandas读写csv文件(4)

如果我们有许多数据帧,并且我们想将它们全部导出到同一个csv文件中。 这是为了创建两个新的列,命名为group和row num。重要的部分是group,它将标...

892
用户1359560

Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(3)

如果我们有来自许多来源的数据,如果要同时分析来自不同CSV文件的数据,我们可能希望将它们全部加载到一个数据帧中。在接下来的示例中,我们将使用Pandas rea...

903
用户1359560

Python从零开始第三章数据处理与分析①python中的dplyr(1)

我经常使用R的dplyr软件包进行探索性数据分析和数据处理。 dplyr除了提供一组可用于解决最常见数据操作问题的一致函数外,dplyr还允许用户使用管道函数编...

984
用户1359560

Python从零开始第三章数据处理与分析①python中的dplyr(2)目录

===============================================

931
用户1359560

Python从零开始第三章数据处理与分析python中的dplyr(3)目录

===============================================

833
用户1359560

Python从零开始第三章数据处理与分析python中的dplyr(4)目录

可以使用separate(column,into,sep =“[\ W _] +”,remove = True,convert = False,extra ='...

992
用户1359560

Python从零开始第三章数据处理与分析python中的dplyr(5)目录

===============================================

923
用户1359560

Python从零开始第五章生物信息学⑥GEO数据库实战分析(1)目录正文

GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各...

2155
用户1359560

Python从零开始第五章生物信息学⑤生存分析(log-rank)目录正文

生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小...

1803
用户1359560

Python数据处理从零开始----第三章(pandas)⑤pandas与R目录

===============================================

1223
用户1359560

Python从零开始第五章生物信息学(3):查询目录正文

通常,方法需要访问在线KEGG数据库,因此需要时间。 例如,上面的命令需要几秒钟。 但是,有些是缓冲的,所以下次调用它时会更快。另一个有用的别名是检索所有通路I...

1033
用户1359560

R.python常见问题④(R语言添加环境变量)

打开环境变量对话框,控制面板>系统>高级系统设置>环境变量,选择“Path”这个环境变量,点击编辑,可以添加环境变量的值,添加Rscript.exe 所在的路径...

942
用户1359560

R.python常见问题②(一些需要编译的包)

在R语言的广泛包中,大部分可以直接install.packages()直接命令安装,但是有些包安装过程比较复杂,例如'lightgbm,ggplot2所依赖的‘...

1002
用户1359560

使用R语言进行机器学习特征选择②

特征工程其实是一个偏工程的术语,在数据库领域可能叫做属性选择,而在统计学领域叫变量选择,其实是一个意思:即最大限度地从原始数据中提取有用信息以供算法和模型使用,...

1862

扫码关注云+社区

领取腾讯云代金券