首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【R语言】数据框按两列排序

我相信大家经常会使用Excel对数据进行排序。有时候我们会按照两个条件来对数据排序。假设我们手上有下面这套数据,9个人,第二列(score)为他们的考试成绩,第三列(code)为对应的评级。...主要用的是R中的order这个函数。...#读入文件,data.txt中存放的数据为以上表格中展示的数据 file=read.table(file="data.txt",header=T,sep="\t") #先按照code升序,再按照Score...,只需要前面加个负号就可以了 View(file[order(file$Code,-file$Score),]) 下面是按照code升序,然后再按score降序排列的结果,是不是跟Excel处理的结果一样...在R里面我们还可以指定code按照一定的顺序来排列 #按照指定的因子顺序排序,先good,在excellent,最后poor file$Code <- factor(file$Code , levels

2.3K20

Excel按某一列数据从另一列找到对应字段的数值

本文介绍在Excel中,从某一列数据中找到与已知数据对应的字段,并提取这个字段对应数值的方法。   首先,来明确一下我们的需求。...现在已知一个Excel数据,假设其中W列包含了上海市全部社区的名称,而其后的Y列则是这些社区对应的面积;随后,Z列是另一批社区的名称,其中既有上海市的社区(也就是在W列中的数据),也可能会有其他城市的社区...我们希望,基于前面的W列与Y列,分别提取Z列社区对应的面积,存放在AA列里。如下图所示。   明确了需求,我们就可以通过Excel的公式来实现这一需求。...需求的实现也是很简单的,我们只需要在AA列中第一个数据行中,输入如下的公式即可。 =VLOOKUP(Z2,$W$2:$Y$53,3,FALSE)   其中,VLOOKUP是Excel中的查询函数。...此外,在列号字母和行号数字前,一定要加   随后,3表示在用来【寻找社区面积】的那一堆数据里,社区面积排在第几列。

16910
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    seaborn可视化数据框中的多个列元素

    seaborn提供了一个快速展示数据库中列元素分布和相互关系的函数,即pairplot函数,该函数会自动选取数据框中值为数字的列元素,通过方阵的形式展现其分布和关系,其中对角线用于展示各个列元素的分布情况...,剩余的空间则展示每两个列元素之间的关系,基本用法如下 >>> df = pd.read_csv("penguins.csv") >>> sns.pairplot(df) >>> plt.show()...函数自动选了数据框中的3列元素进行可视化,对角线上,以直方图的形式展示每列元素的分布,而关于对角线堆成的上,下半角则用于可视化两列之间的关系,默认的可视化形式是散点图,该函数常用的参数有以下几个 ###...#### 3、 x_vars和y_vars 默认情况下,程序会对数据框中所有的数值列进行可视化,通过x_vars和y_vars可以用列名称来指定我们需要可视化的列,用法如下 >>> sns.pairplot...通过pairpplot函数,可以同时展示数据框中的多个数值型列元素的关系,在快速探究一组数据的分布时,非常的好用。

    5.2K31

    【Python】基于某些列删除数据框中的重复值

    =True) 按照多列去重实例 一、drop_duplicates函数介绍 drop_duplicates函数可以按某列去重,也可以按多列去重。...subset:用来指定特定的列,根据指定的列对数据框去重。默认值为None,即DataFrame中一行元素全部相同时才去除。...导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv('name.csv...结果和按照某一列去重(参数为默认值)是一样的。 如果想保留原始数据框直接用默认值即可,如果想直接在原始数据框删重可设置参数inplace=True。...如需处理这种类型的数据去重问题,参见本公众号中的文章【Python】基于多列组合删除数据框中的重复值。 -end-

    20.5K31

    2.37 PowerBI数据建模-按列排序的副作用,ALL失效了

    使用ALL函数来计算占比,明明公式正确,返回的百分比却都是100%,百思不得其解,这是软件的Bug吗? 举例基于下表,计算每个班级的人数占比。...班级人数'[人数])总人数_Wrong = CALCULATE([人数],ALL('班级人数'[班级]))班级人数占比_Wrong = DIVIDE([人数],[总人数])异常结果如下:解决方案班级这一列使用了按列排序...,把班级字段拖入报表中的时候,实际上还拖入了一个看不到的班级排序字段,这样才能实现排序的效果。...这种情况下,ALL函数只用了一个字段,并没有彻底清除筛选,所以分母的总人数返回的还是每个班级的人数。把字段和排序字段都放到ALL的参数中,就会返回正确的结果。...本例把ALL的参数调整为班级和用于排序的班级排序字段,如下:总人数 = CALCULATE([人数],ALL('班级人数'[班级],'班级人数'[班级排序]))拓展按列排序还会有其他的副作用,比如判断某个被排序的字段是否被筛选

    3500

    【Python】基于多列组合删除数据框中的重复值

    最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。...本文介绍一句语句解决多列组合删除数据框中重复值的问题。 一、举一个小例子 在Python中有一个包含3列的数据框,希望根据列name1和name2组合(在两行中顺序不一样)消除重复项。...import numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 df =...打印原始数据行数: print(df.shape) 得到结果: (130, 3) 由于每两行中有一行是重复的,希望数据处理后得到一个65行3列的去重数据框。...从上图可以看出用set替换frozense会报不可哈希的错误。 三、把代码推广到多列 解决多列组合删除数据框中重复值的问题,只要把代码中取两列的代码变成多列即可。

    14.7K30

    R 茶话会(七:高效的处理数据框的列)

    前言 这个笔记的起因是在学习DataExplorer 包的时候,发现: 这我乍一看,牛批啊。这语法还挺长见识的。 转念思考了一下,其实目的也就是将数据框中的指定列转换为因子。...换句话说,就是如何可以批量的对数据框的指定行或者列进行某种操作。...(这里更多强调的是对原始数据框的直接操作,如果是统计计算直接找summarise 和它的小伙伴们,其他的玩意儿也各有不同,掉头左转: 34....R 数据整理(六:根据分类新增列的种种方法 1.0) 其实按照我的思路,还是惯用的循环了,对数据框的列名判断一下,如果所取的列在数据框中,就修改一下其格式,重新赋值: data(cancer, package...这里就回到开始的问题了,如果是希望对数据框本身进行处理,而非统计学运算呢?

    1.5K20

    学徒讨论-在数据框里面使用每列的平均值替换NA

    最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值。但是问题的提出者自己的代码是错的,如下: ? 他认为替换不干净,应该是循环有问题。...#我好像试着写出来了,上面的这个将每一列的NA替换成每一列的平均值。 #代码如下,请各位老师瞅瞅有没有毛病。...:我是这么想的,也不知道对不对,希望各位老师能指正一下:因为tmp数据框中,NA个数不唯一,我还想获取他们的横坐标的话,输出的结果就为一个list而不是一个数据框了。...a=1:1000 a[sample(a,100)]=NA dim(a)=c(20,50) a # 按照列,替换每一列的NA值为该列的平均值 b=apply(a,2,function(x){ x[is.na...,就数据框的长-宽转换!

    3.6K20

    R语言第二章数据处理⑤数据框列的转化和计算目录正文

    正文 本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数: Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。...同时还有mutate()和transmutate()的三个变体来一次修改多个列: Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。...Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列...tbl:一个tbl数据框 funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。...转换特定列 mutate_at():转换按名称选择的特定列: my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),

    4.2K20

    问与答62: 如何按指定个数在Excel中获得一列数据的所有可能组合?

    excelperfect Q:数据放置在列A中,我要得到这些数据中任意3个数据的所有可能组合。如下图1所示,列A中存放了5个数据,要得到这5个数据中任意3个数据的所有可能组合,如列B中所示。...Dim n AsLong Dim vElements As Variant Dim lRow As Long Dim vResult As Variant '要组合的数据在当前工作表的列...A Set rng =Range("A1", Range("A1").End(xlDown)) '设置每个组合需要的数据个数 n = 3 '在数组中存储要组合的数据...lRow = lRow + 1 Range("B" & lRow) = Join(vResult, ", ") '每组组合放置在多列中...代码的图片版如下: ? 如果将代码中注释掉的代码恢复,也就是将组合结果放置在多列中,运行后的结果如下图2所示。 ? 图2

    5.6K30

    PQ-M及函数:如何按某列数据筛选出一个表里最大的行?

    关于筛选出最大行的问题,通常有两种情况,即: 1、最大行(按年龄)没有重复,比如这样: 2、最大行(按年龄)有重复,比如这样: 对于第1种情况,要筛选出来比较简单...,直接用Table.Max函数即可(得到的是一个记录,也体现了其结果的唯一性),如下图所示: 对于第2种情况,可以考虑用Table.SelectRows函数来进行筛选,即筛选出年龄等于源表...(数据导入Power Query后做了类型更改,产生了”更改的类型“步骤)中最大值(通过List.Max函数取得,主要其引用的是源表中的年龄列)的内容: 当然,第2种情况其实是适用于第1...种情况的。...这也是为什么说——Table.SelectRows这个函数非常常用,其可使用的场景非常的多。

    2.7K20

    C语言经典100例002-将M行N列的二维数组中的字符数据,按列的顺序依次放到一个字符串中

    喜欢的同学记得点赞、转发、收藏哦~ 后续C语言经典100例将会以pdf和代码的形式发放到公众号 欢迎关注:计算广告生态 即时查收 1 题目 编写函数fun() 函数功能:将M行N列的二维数组中的字符数据...,按列的顺序依次放到一个字符串中 例如: 二维数组中的数据为: W W W W S S S S H H H H 则字符串中的内容是:WSHWSHWSH [image.png] 2 思路 第一层循环按照列数进行...M 3 #define N 4 /** 编写函数fun() 函数功能:将M行N列的二维数组中的字符数据,按列的顺序依次放到一个字符串中 例如: 二维数组中的数据为: W W W W S S S..."%c\t", a[i][j]); // printf("%c\t", *(*(a*i)+j)); // 指针表示 } printf("\n"); } printf("按列的顺序依次.../demo 二维数组中元素: M M M M S S S S H H H H 按列的顺序依次: MSHMSHMSHMSH -- END -- 喜欢本文的同学记得点赞、转发、收藏~ 更多内容,欢迎大家关注我们的公众号

    6.1K30

    【数据结构】数组和字符串(八):稀疏矩阵的链接存储:十字链表的创建、插入元素、遍历打印(按行、按列、打印矩阵)、销毁

    4.2.1 矩阵的数组表示 【数据结构】数组和字符串(一):矩阵的数组表示 4.2.2 特殊矩阵的压缩存储   矩阵是以按行优先次序将所有矩阵元素存放在一个一维数组中。...传统的按行优先次序存储方法会浪费大量空间来存储零元素,因此采用压缩存储的方法更为合适。常见的压缩存储方法有:压缩稠密行(CSR)、压缩稠密列(CSC)、坐标列表(COO)等。 a....对角矩阵的压缩存储 【数据结构】数组和字符串(二):特殊矩阵的压缩存储:对角矩阵——一维数组 b~c....稀疏矩阵的压缩存储——三元组表 【数据结构】数组和字符串(四):特殊矩阵的压缩存储:稀疏矩阵——三元组表 4.2.3三元组表的转置、加法、乘法、操作 【数据结构】数组和字符串(七):特殊矩阵的压缩存储:...关于循环链表: 【数据结构】线性表(三)循环链表的各种操作(创建、插入、查找、删除、修改、遍历打印、释放内存空间) 在稀疏矩阵的十字链表中,每一行和每一列都有一个表头节点。

    24110

    1.22 PowerBI数据准备-笛卡尔积、有序排列组合、无序排列组合

    比如笛卡尔积,有一张店铺表和一张产品表,需要把店铺表和产品表交叉相乘,进行笛卡尔积运算,让店铺表中的每一个的店铺都匹配到产品表中的每一个产品,用于模型建立关系的中间表或者其他用途。...举例有一个成员表,成员列中有4个成员A、B、C、D。组合方式有3种:1 笛卡尔积,Cartesian product,相同的成员也组合,考虑成员的前后顺序。...操作步骤1 笛卡尔积STEP 1 PowerQuery获取数据后,在左侧的成员表上点击鼠标右键,选择下面的复制,生成一份成员表的副本。...共16种可能,结果如下:2 有序排列组合在笛卡尔积的基础上,添加辅助条件列,判断两列成员是否相等,筛选不相等的部分,最后删除辅助列。...共12种可能,结果如下:3 无序排列组合在有序排列组合的基础上,添加辅助自定义列对两列成员按相同顺序组合,选中辅助列删除重复项,最后删除辅助列。

    5600

    盘点 Pandas 中用于合并数据的 5 个最常用的函数!

    df0.merge(df1, left_on="a", right_on="c") 除了 a 和 c 的单独列之外,它的结果与之前的合并几乎相同。这里,额外提两个特殊参数:笛卡尔积、使用后缀。...笛卡尔积 how 参数设置为cross,构成笛卡尔积。是指两个数据框中的数据交叉匹配,出现n1*n2的数据量,具体如下所示。...默认情况下,左右数据框的后缀是“_x”和“_y”,我们还可以通过suffixes参数自定义设置。...在这种情况下,df1 的 a 列和 b 列将作为平方,产生最终值,如上面的代码片段所示 5、append 回顾前文,我们讨论的大多数操作都是针对按列来合并数据。 如果按行合并(纵向)该如何操作呢?...他们分别是: concat[1]:按行和按列 合并数据; join[2]:使用索引按行合 并数据; merge[3]:按列合并数据,如数据库连接操作; combine[4]:按列合并数据,具有列间(相同列

    3.4K30

    这才是你寻寻觅觅想要的 Python 可视化神器

    它带有数据集、颜色面板和主题,就像 Plotly.py 一样。 Plotly Express 完全免费:凭借其宽松的开源 MIT 许可证,您可以随意使用它(是的,甚至在商业产品中!)。...在这个最终版本中,让我们在这里调整一些显示,因为像“gdpPercap” 这样的文本有点难看,即使它是我们的数据框列的名称。...大多数二维笛卡尔图接受连续或分类数据,并自动处理日期/时间数据。 可以查看我们的图库 (ref-3) 来了解每个图表的例子。 ?...甚至是 动画帧到数据框(dataframe)中的列。...这种方法的强大之处在于它以相同的方式处理所有可视化变量:您可以将数据框列映射到颜色,然后通过更改参数来改变您的想法并将其映射到大小或进行行分面(facet-row)。

    3.7K20

    这才是你寻寻觅觅想要的 Python 可视化神器!

    它带有数据集、颜色面板和主题,就像 Plotly.py 一样。 Plotly Express 完全免费:凭借其宽松的开源 MIT 许可证,您可以随意使用它(是的,甚至在商业产品中!)。...在这个最终版本中,让我们在这里调整一些显示,因为像“gdpPercap” 这样的文本有点难看,即使它是我们的数据框列的名称。...大多数二维笛卡尔图接受连续或分类数据,并自动处理日期/时间数据。 可以查看我们的图库 (ref-3) 来了解每个图表的例子。 ?...甚至是 动画帧到数据框(dataframe)中的列。...这种方法的强大之处在于它以相同的方式处理所有可视化变量:您可以将数据框列映射到颜色,然后通过更改参数来改变您的想法并将其映射到大小或进行行分面(facet-row)。

    4.2K21

    强烈推荐一款Python可视化神器!

    以下是内置的 Gapminder 数据集的示例,显示2007年按国家/地区的人均预期寿命和人均GDP 之间的趋势: ?...在这个最终版本中,让我们在这里调整一些显示,因为像“gdpPercap” 这样的文本有点难看,即使它是我们的数据框列的名称。...大多数二维笛卡尔图接受连续或分类数据,并自动处理日期/时间数据。 可以查看我们的图库 (ref-3) 来了解每个图表的例子。 ?...甚至是 动画帧到数据框(dataframe)中的列。...这种方法的强大之处在于它以相同的方式处理所有可视化变量:您可以将数据框列映射到颜色,然后通过更改参数来改变您的想法并将其映射到大小或进行行分面(facet-row)。

    4.4K30
    领券