生信技巧第3课-请你务必学好R语言

长期更新列表: 视频讲解-R爬取生信软件列表到思维导图 生信技巧第二课-使用markdown记录和分享笔记

本期视频,学会R语言,方便你我他~~~

视频内容
  • 为什么需要学习R语言呢?
    • 可能是想画一个热图
    • 或是想做GEO芯片数据分析
    • 也可以说是各种统计分析(比如生存分析,差异分析,lasso回归)
  • 各种搜索渠道
    • https://biotree.ke.qq.com/
    • http://study.163.com/
    • 百度云资料
    • 入门书籍:https://mp.weixin.qq.com/s/Gks3ogPPpsagocxjeBp8dQ
  • 了解并安装R
    • 安装包 install.packages(" xxxxxx ")
    • 加载包 library( xxxxx )
    • 查看包的帮助文档help("xxxxx") 或?xxxxx
    • 获取当前工作区间getwd() 更改工作区间
    • setwd( "xxxxxx")
    • 清除当前对象rm()
    • 安装包你一定会遇到错误,请参考: R包终极解决方案!(http://www.biotrainee.com/thread-144-1-1.html)
    • R的包(package)(http://www.bio-info-trainee.com/579.html)
    • 下载R语言的软件: https://cran.r-project.org/bin/windows/base/
    • 下载Rstudio这个R编辑器: https://www.rstudio.com/products/rstudio/download/
    • 安装一些必要的包,了解CRAN和bioconductor
  • 理解R语言与Excel表格在数据处理的异同点
    • 重中之重!!!
  • 明白R中的变量
    • 向量和因子:向量特简单,没什么好说的,因子太复杂了,我说不清楚,你们慢慢理解。
    • 数据框:就像我们的表格,第一行就是每一列的名字,我们称之为字段,或者变量名。那么对应每列下面的数据就叫做记录或者观测。用data.frame( 字段1,字段2,…. )创建 )
    • 列表:与数据框类似,区别就是每一列向量类型和长度可以不一致。用list( 字段1, 字段2,….. )创建
    • 数组:其形式就像我们玩的模方,每一个面都是一个矩阵数据,用array(数据,各维度的最大值,各维度的名称)
  • 了解变量的基础操作函数
    • str,class,names,row.names,col.names,length,unique,view,min,max,summay,table
    • 我们处理生物信息学数据一般很少会手动创建这些对象,都是从文本里面读取,比如kegg数据库文件,差异分析结果,RNA-seq的表达量矩阵,但是读入之后,我们的重点就是知道它们变成了什么,该如何去一步步的转换它们。
    • 变量怎么来,对它们处理什么?
    • 数据的特性函数也必须要知道,无非就是一些英文单词而已,你经常的玩一下,就慢慢的熟练了。
  • 数据对象的高级操作
    • 前面我们对向量,数据框,数组,列表都了解了,也知道如何查看数据的特性,但是要进行高级转换,就需要一些时间来学习apply系列函数,aggregate,split等函数的用法。这是一个分水岭,用好了你就算是R入门了。也可以用一些包,比如reshape2,dplyr。
    • 当然,R里面的字符串对象是另外完全不一样的操作模式,建议大家自行搜索学习。
  • 高级分支
    • 统计学
    • 可视化
    • bioconductor与生物信息学
    • shiny与网页

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2018-05-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吉浦迅科技

DAY79:阅读 Compute Capabilities

The general specifications and features of a compute device depend on its comput...

1842
来自专栏机器学习和数学

[Tensorflow] TensorFlow之Hello World!(1)

哇!今天挺开心的,30天的时间,19篇文章,2459人阅读,5313人次阅读!今天开通的原创标识,恩!除了激动,就是非常感谢大家的支持!感谢大家的支持!大家的支...

3406
来自专栏算法channel

BAT面试题2:请简要介绍下Tensorflow的计算图

接下来,每天推送一道BAT的面试题,一般问到的这些知识点都是很重要的,所以知道的就再复习一下,不知道的希望这篇可以帮助到你。日积月累,你会在不知不觉中就步入机器...

1.8K2
来自专栏华章科技

教程 | 如何优雅而高效地使用Matplotlib实现数据可视化

Matplotlib 能创建非常多的可视化图表,它也有一个丰富的 Python 工具生态环境,很多更高级的可视化工具使用 Matplotlib 作为基础库。因此...

662
来自专栏机器之心

学界 | 为代码自动添加注释,让 Java 程序的阅读和开发更高效

3627
来自专栏ATYUN订阅号

使用50行Python教AI玩运杆游戏

嗨,大家好!今天我想展示如何使用50行Python代码教一台机器来平衡杆!我们将使用标准的OpenAI Gym作为我们的测试环境,并只使用numpy创建我们的智...

1703
来自专栏人工智能头条

MXNet设计笔记之:深度学习的编程模式比较

2113
来自专栏机器之心

教程 | 如何使用JavaScript构建机器学习模型

选自:hackernoon 作者:Abhishek Soni 参与:李泽南 目前,机器学习领域建模的主要语言是 Python 和 R,前不久腾讯推出的机器学习框...

3336
来自专栏CDA数据分析师

如何高效地学好 R?

本文由知乎著名答主黄宝臣原创,CDA数据分析师已获得授权 学R主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*,write.*)、数据结构知...

1975
来自专栏韩东吉的Unity杂货铺

零基础入门 31:游戏中的变速效果

今天给大家带来一篇短小精悍的内容,那就是游戏中的变速效果,变速包括了快速和慢速,有的时候在游戏关卡结尾的时候通过慢速慢镜头来展示结束动作特效等,有不错的表现效果...

992

扫码关注云+社区

领取腾讯云代金券