前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >阿榜的生信笔记10—R语言综合运用2

阿榜的生信笔记10—R语言综合运用2

原创
作者头像
用户10480134
发布2023-05-02 21:58:53
6890
发布2023-05-02 21:58:53
举报
文章被收录于专栏:黄金榜黄金榜

哈喽,我是学习生物信息学的阿榜!非常感谢您能够点击进来查看我的笔记。我致力于通过笔记,将生物信息学知识分享给更多的人。如果有任何纰漏或谬误,欢迎指正。让我们一起加油,一起学习进步鸭🦆

一、apply()隐式循环

apply() 函数是一种隐式循环函数,可以在矩阵、数组、数据框等对象上进行操作。它的基本语法如下:

apply(X, MARGIN, FUN, ...):对X的每一个维度(1对行、2对列)进行FUN函数操作

X :需要操作的对象;

MARGIN: X 的哪个维度需要进行循环操作,1是行、2是列;

FUN 是用于操作的函数;

... 表示可以传入其他参数;

下面是一个例子,对矩阵 mat 的每一列进行求和操作:

代码语言:text
复制
mat <- matrix(1:9, 3, 3)
mat
apply(mat, 2, sum)

这里的 2 表示对 mat 矩阵的列进行操作, sum 表示对mat的每一列进行求和操作。

二、两个数据的连接

inner_join(x, y) : 返回x和y交集,即两个数据集中有相同值的行。

left_join(x, y) : 返回以x为基础的所有行,并将y中的匹配行合并到x中。如果y中没有匹配的行,则将其相应列填充为 NA 。

right_join(x, y) : 返回以y为基础的所有行,并将x中的匹配行合并到y中。如果x中没有匹配的行,则将其相应列填充为 NA 。

full_join(x, y) : 返回x和y的并集,并将两个数据集中的匹配行合并到一起。如果有匹配的行,则返回匹配行的交集。如果没有匹配的行,则将其相应列填充为 NA 。

semi_join(x, y) : 返回x中有匹配行的子集。

anti_join(x, y) : 返回x中没有匹配行的子集。

操作运行结果如下图所示:

三、以下是常见的问题以及解决办法:

  1. "Error: object 'x' not found"错误 这种错误通常是因为没有正确加载或定义变量 x导致的。解决方法是检查变量名是否拼写正确,或者是否已经正确定义。 如果需要加载变量,则需要将数据导入到R中,可以使用 read.table() 、 read.csv() 等函数加载数据。
  2. "Error in FUN(X[i], ...) : could not find function "x""错误 这种错误通常是因为没有正确加载需要的包或者函数 x无法识别导致的。解决方法是在代码中添加 library(x) 加载需要的包,或者使用 require(x) 加载包。
  3. "Error in split.default(x, f) : first argument must be a data frame or a vector"错误 这种错误通常是因为使用的数据类型不正确导致的。解决方法是检查数据类型是否正确。
  4. "Error in model.frame.default(formula = y ~ x, data = df) : invalid type (NULL) for variable 'y'"错误 这种错误通常是因为使用的数据集中缺少需要的列或者有空值 NA 导致的。解决方法是检查数据集中是否缺少需要的列或者是否存在 NA 值。
  5. "Error: package or namespace load failed"错误 这种错误通常是因为加载的包损坏或者版本不匹配导致的。解决方法是重新安装或更新需要的包,并使用 library() 重新加载包。 以上是我这次在学习生物信息学过程中所整理的笔记。如果大家对这个领域也感兴趣,欢迎加我好友,我的qq号是1841113542。希望大家能够一起学习,共同进步。如果在笔记中有错误或者不足之处,欢迎大家指正,我们一起加油鸭🦆引用自生信技能树——小洁老师

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云原生分布式云中心
云原生分布式云中心(Tencent Kubernetes Engine Distributed Cloud Center, TDCC)是面向多云多集群场景的应用管理平台,支持将云原生化的应用扩展到分布式云,全局视角统一管理和运维分布式云资源,轻松地将您的业务发布至全球,一次部署处处运行。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档