从R dataframe中获取用于排序数据的唯一元素

文章/答案/技术大牛

发布

1回答

我正在R Studio中对排序数据进行一些数据转换。我想从我的测序数据中获得独特的频道。sequence success2 b > c > a > d 1在这种情况下，我想获得所有独特的通道所以我的输出应该是这样的-ac

浏览 9提问于2018-07-26得票数 0

1回答

经常添加和请求排序数据

java、sorting、types

如果id已经存在，则添加新记录时，新记录替换旧记录，id在数据集中是唯一的。很多时候，我需要得到分类数据(按价格)。像前100或25-50的位置在数据集中。好消息是，每次我需要排序的数据都是从数据集开始的。(我在可能的情况下使用了类似的compareTo(Object ))。当需要数据时对其进行排序。太慢了。 Has

浏览 0提问于2018-04-03得票数 1

1回答

Pyspark排序并获取第一个和最后一个

pyspark

我使用下面的代码基于一列进行排序。我想知道如何获取排序数据帧中的第一个元素和最后一个元素？group_by_dataframe .filter("`count` >= 10") .sort(desc("count"))

浏览 2提问于2019-08-22得票数 1

1回答

基于未排序/不可排序列表的列合并数据仓库

python

我想根据第一个dataframe的值合并两个数据格式。但是，标识符列中充满了列表，更糟糕的是，列表中元素的顺序是不可排序的，并且可能与第二个dataframe列表中元素的顺序不同，即使元素是相同的。因此，基本上，我希望第一个dataframe包含更多来自第二个dataframe的信息，基于这些

浏览 1提问于2022-11-08得票数 2

回答已采纳

3回答

什么是火花-scala的解决方案来对分组数据中的非键非整数列中的数据进行排序？

scala、apache-spark、apache-spark-sql

对按产品价格分类的产品数据进行分类groupByCategory.take(2).foreach(println) RDD元素按照Category_id正确地分组，之后我必须根据scala中的product_price对数据进行排序如果将product

浏览 1提问于2019-08-12得票数 1

2回答

如何从列表中选择特定值并绘制海运箱线图？

python-3.x、seaborn、boxplot、numpy-ndarray

我有一个列表(长度300)的列表(每个长度1000)。我想按每个包含1000个列表的中位数对300个列表进行排序，然后绘制前10个列表(即具有最大中位数的10个列表)的海运箱形图。我能够绘制出整个300人的列表，但不知道从哪里开始。我可以绘制一个点的范围，但是如何绘制，例如: data3，data45，data129都在同一个图中？ax = sns.boxplot(data = data[0:50]) 我也可以通过这样做来找出列表中

浏览 11提问于2019-05-31得票数 1

回答已采纳

1回答

在excel python数据抓取分配方面需要帮助

python、pandas

对于这个任务，我们从Twitter上得到一个excel数据集，并被认为是“刮取数据”。我一直在使用熊猫，我找不到正确的代码字符串来完成我的需要。我能够使用这段代码过滤所有只发送"Tweet“的用户。这似乎是我唯一的</

浏览 0提问于2019-09-30得票数 0

1回答

如何从字符串/字符中“扩展”熊猫的数据？

python、python-3.x、pandas

我从一张清单中生成了一份熊猫数据：lis = [['baby ferrets\ntype: mamal\n»age:2\n»food: Renal'],['dog\ntype: mamal\n»ntype: mamal\n»age: 1\n»food: meat'], ['iguana\ntype: reptile\n»age: 2\n»food: crickets']] df = pd.DataFrameexotic pet)\ntype: mamal\n»age: 1\n»food:

浏览 2提问于2016-11-07得票数 2

回答已采纳

3回答

如何获得dataframe列中每个唯一值的计数，即使我不知道唯一值是什么？

r、dataframe

基本上，我希望标识R dataframe列中的唯一值，并获得每个值的计数，最终目标是将它们的计数从大到小排序。你知道我该怎么做吗？提前谢谢你！

浏览 3提问于2020-03-06得票数 0

2回答

C#高效的数据结构，用于存储按密钥排序的对象和重复密钥，以满足给定的要求

c#、sorting、data-structures、collections

用于将元素插入排序数据结构或从排序数据结构中删除元素的复杂类不应该高于O(log(N)) (在中指出)，因为用于排序的属性将经常更改，为了保持一致性，必须根据每次更改更新列表。按排序顺序将数据结构中的所有元素作为列表的复杂类不应高于O(1)。选项可以是C#

浏览 3提问于2020-03-20得票数 0

回答已采纳

2回答

使用R的plyr包重新排序数据帧中的组

r、loops、plyr、dplyr

我有一项数据重组任务，我认为可以由R的plyr包来处理。我有一个数据格式，其中包含按组组织的数字数据。在每个组中，我需要将数据从最大到最小排序。order的内容，按顺序进行重组，保存数据的重新排序子集，并在最后将它们重新组合在一起。：我目前的方法是将dataframe df按组划分为一个列表，将order应<

浏览 2提问于2015-02-03得票数 0

1回答

如何滚动到ListView中新添加的项目

android、listview、cursor、cursor-position

我应用程序显示了一个带有按钮的ListView，允许用户添加元素。当用户单击此按钮时，将启动另一个活动以允许用户填充新元素。添加完成后，我们使用ListView返回到前面的活动，我想滚动到新元素。注意，这个元素不一定在ListView的末尾，因为当我从数据库检索数据时，会有一个"order by“。我知道我需要新元素的光标位置来使ListView滚动到它，但是关于这个元素

浏览 0提问于2010-05-07得票数 1

回答已采纳

1回答

如何在文件中找到最大长度的单词？

python、dataframe

我在一个ps4游戏网站上做了一个抓取，我抓取了变量product_name下的游戏名称和变量price下的发货价格，并将其保存在'dataframe.cvs‘文件中。如何从dataframe.cvs中打印出名称最长的游戏。我找的不是运费，而是游戏的名称。append(product_name) d1['pric

浏览 27提问于2020-11-20得票数 0

2回答

在从数组中呈现项时正确选择React键

javascript、reactjs、key

我最近一直在研究元素的键在反应中的重要性，我仍然对此感到有些困惑。问题是，已经获取的行数据可以在刷新之间进行更改(通过由其他用户编

浏览 3提问于2021-09-20得票数 0

回答已采纳

2回答

R中两根不同长度柱的比较

r、dataframe

我试图在R中实现vlookup类型的功能，我有两个数据帧- Id列具有唯一的值。# DataFrame1 - df1R1 ax 12 33 11R5 ag 2 3 1 Id

浏览 1提问于2016-06-22得票数 1

回答已采纳

1回答

如何将相同密钥的记录写入多个文件(自定义分区程序)

apache-spark

我希望使用Spark动态地将数据从目录写入分区。这是示例代码。作业是成功地完成时，每个执行器的高内存(15 to )，但太长的时间来完成。我尝试过使用重新分区，希望它能够在分区之间均匀地分配数据。剩余的部件文件没有记录(只有Parquet元数据，38364字节)。DataFrame/RDD的不同分区？由于预期的结果只是基于键将数据写入不同的子目录(Hive的</

浏览 1提问于2017-11-20得票数 0

2回答

引用列名和行号更新dataframe的元素

python、python-3.x、pandas、dataframe

我来自一个R背景，并且习惯于通过使用如下语法从数据帧中检索值：我可以用下面的语法给数据帧赋值：employ.data$employee[2] <= 'Some other name' 我现在正在学习一些Python，<e

浏览 3提问于2020-08-24得票数 3

2回答

使用最少的代码按外部列表排序Pandas Dataframe

python、r、pandas

我只想重新排序我的pandas数据帧中的行，以便col1与my_order中的外部列表元素的顺序相匹配。d = {'col1': ['A', 'B', 'C'], 'col2': [1,2,3]}my_order = ['B', 'C&

浏览 8提问于2020-07-07得票数 0

1回答

group by期间纱线杀死的火花容器

apache-spark、hadoop-yarn

我有一个从Hbase中提取的数据集，这是宽表的一个很长的形式，即有rowKey，columnQualifier和value列。要获得某种形式的pivot，我需要按rowKey分组，这是一个字符串UUID，放入一个集合并在该集合中创建一个对象。问题是，我唯一要执行的group-by是统计group中的元素数量；其他group-by失败的原因是容器由于内存溢出超出了纱

浏览 13提问于2017-02-16得票数 1

回答已采纳

1回答

星火DStream排序取N个元素

apache-spark、spark-streaming

我使用火花流从kafka集群读取数据。我想排序一个DStream对和得到顶N单独。._2, false))我的问题是转换操作由rdd应用于rdd。那么，结果会在所有rdd中跨元素排序吗？

浏览 4提问于2015-10-07得票数 4

点击加载更多