专栏首页生信小驿站R语言教程,去除重复的蛋白质、基因互作关系

R语言教程,去除重复的蛋白质、基因互作关系

有的时候,蛋白质互作关系会出现重复,比如说我们有两列数据框,蛋白质a和蛋白质b可能会出现多次。

> df <-data.frame(c("a", "a", "a", "c", "c", "c", 'b', 'b'),
+                 c("a", "b", "c", "a", "b", "c", 'a', 'c'), 
+                 stringsAsFactors=F)
> 
> colnames(df)<-c("c1", "c2")
> 
> df
  c1 c2
1  a  a
2  a  b
3  a  c
4  c  a
5  c  b
6  c  c
7  b  a
8  b  c
> 
> 
> apply(df, 1, sort)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] "a"  "a"  "a"  "a"  "b"  "c"  "a"  "b" 
[2,] "a"  "b"  "c"  "c"  "c"  "c"  "b"  "c" 
> 
> t(apply(df, 1, sort))
     [,1] [,2]
[1,] "a"  "a" 
[2,] "a"  "b" 
[3,] "a"  "c" 
[4,] "a"  "c" 
[5,] "b"  "c" 
[6,] "c"  "c" 
[7,] "a"  "b" 
[8,] "b"  "c" 
> 
> as.data.frame(t(apply(df, 1, sort)))
  V1 V2
1  a  a
2  a  b
3  a  c
4  a  c
5  b  c
6  c  c
7  a  b
8  b  c
> 
> unique(as.data.frame(t(apply(df, 1, sort))))
  V1 V2
1  a  a
2  a  b
3  a  c
5  b  c
6  c  c
> 
> 
> df_unique <- unique(as.data.frame(t(apply(df, 1, sort))))
> rownames(df_unique) <- 1:nrow(df_unique)
> df_unique
  V1 V2
1  a  a
2  a  b
3  a  c
4  b  c
5  c  c
df <-data.frame(c("a", "a", "a", "c", "c", "c", 'b', 'b'),
                c("a", "b", "c", "a", "b", "c", 'a', 'c'), 
                stringsAsFactors=F)

colnames(df)<-c("c1", "c2")

df


apply(df, 1, sort)

t(apply(df, 1, sort))

as.data.frame(t(apply(df, 1, sort)))

unique(as.data.frame(t(apply(df, 1, sort))))


df_unique <- unique(as.data.frame(t(apply(df, 1, sort))))
rownames(df_unique) <- 1:nrow(df_unique)
df_unique

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • pandas入门①数据统计

    本指南直接来自pandas官方网站上的10分钟pandas指南。 我将它改写以使代码更易于访问。 本指南适用于之前未使用pandas的初学者。

    用户1359560
  • Python数据处理从零开始----第四章(可视化)①②堆积柱状图目录使用Matplotlib和Pandas轻松堆积图表

    ===============================================

    用户1359560
  • Python从零开始第六章机器学习①逻辑回归

    在本节中,您将使用机器学习算法解决泰坦尼克号预测问题:Logistic回归。 Logistic回归是一种分类算法,涉及预测事件的结果,例如乘客是否能够在泰坦尼克...

    用户1359560
  • 快乐学习Pandas入门篇:Pandas基础

    寄语:本文对Pandas基础内容进行了梳理,从文件读取与写入、Series及DataFrame基本数据结构、常用基本函数及排序四个模块快速入门。同时,文末给出了...

    Datawhale
  • Python中字段抽取、字段拆分、记录抽取

    1、字段抽取 字段抽取是根据已知列数据的开始和结束位置,抽取出新的列 字段截取函数:slice(start,stop) 注意:和数据结构的访问方式一样,开始位置...

    Erin
  • 基于机器学习算法的时间序列价格异常检测(附代码)

    异常检测也称为异常值检测,是一种数据挖掘过程,用于确定数据集中发现的异常类型并确定其出现的详细信息。 在当今世界,由于大量数据无法手动标记异常值,自动异常检测显...

    量化投资与机器学习微信公众号
  • 【数说】从知乎320万用户爬取的信息分析与数据可视化

    art 1: 动机 作为一个知乎的重度用户,我深深的被知乎社区的高素质群体所吸引,这也是我在微信朋友圈、新浪微博、baidutieba等社区见不到的东西。那么为...

    钱塘数据
  • 知乎320万用户的信息分析与数据可视化

    art 1: 动机 作为一个知乎的重度用户,我深深的被知乎社区的高素质群体所吸引,这也是我在微信朋友圈、新浪微博、baidutieba等社区见不到的东西。那么为...

    机器学习AI算法工程
  • 工具 | 知乎320万用户的信息分析与数据可视化

    art 1: 动机 作为一个知乎的重度用户,我深深的被知乎社区的高素质群体所吸引,这也是我在微信朋友圈、新浪微博、baidutieba等社区见不到的东西。那么为...

    小莹莹
  • pandas数据清洗,排序,索引设置,数据选取

    df.isnull() df的空值为True df.notnull() df的非空值为True

    李智

扫码关注云+社区

领取腾讯云代金券