如何在pyspark.sql.column.Column中拆分数据帧并获取项目计数

、

有时它只有3个部分：89.0.0 我想使用分隔符在不同的列中拆分它们，所以我做到了： cols = split(dfroot_temp["Product_Version"], "\.") .withColumn("Ver_Build", cols.getItem(3)) 现在，有时当数据帧脚本中不

浏览 13提问于2021-07-05得票数 0

回答已采纳

2回答

将数据帧按所有列拆分并插入到数据帧列表中

、、、、

是否有方法在每列的数据帧列表中拆分数据帧，然后在列名(如ab_a、cd_a )中添加计数器或其他内容？示例中的一些随机数据 'cd': [1, 1, -0, 1, -预期的输出将类似于11

浏览 1提问于2021-04-28得票数 1

回答已采纳

1回答

统计pandas数据帧中子元素的出现次数

、

我有一个熊猫数据框-----javascript|html|React我需要按groupby_tags={'c#','.net','python'}计数我怎么用python来做呢？

浏览 0提问于2020-08-13得票数 0

3回答

将数据帧导出到不同的CSV，每个CSV有1000行

、、、、

但我不知道如何在Python中最好地解决这个问题。首先，将数据帧拆分成多个数据帧，还是直接导出到CSV？每个CSV都需要相同的第一行，这是数据帧中的第一行。但是，该文件不包含运行计数器、ID或其他。

浏览 2提问于2019-12-18得票数 2

回答已采纳

1回答

select top 1* from C返回count size作为分区数* cosmosdb中的实际查询计数

、、

我正在使用scala的azure-cosmosdb-spark库，并且我试图查询以下内容 select top 1 * from c 但我得到的最终数据帧计数是8而不是1。我怀疑CosmosDBRDDIterator将其拆分成多个分区(在本例中为8)并处理查询。无论执行的是select查询，结果计数始终是实际结果计数的8倍。有没有什么方法可以避免这种情况，并使我的实际计数为1？

浏览 3提问于2020-07-25得票数 0

1回答

如何显示我的文章创建的年份和月份(PHP，Yii2)？

、、

我在我的DB中有表：我需要显示创建文章的所有月份和年份，并计算如下：Jan

浏览 0提问于2018-09-06得票数 1

1回答

分组记录后计数单词

，并对每个组进行简单的单词计数。我的问题是，我不知道如何在PySpark中做到这一点。在第一步中，我将拆分文本并将文档作为标记列表： if text is None:| 3|[hello, how, are,...|+-----+--------------------+ 我知道如何在</e

浏览 0提问于2018-04-19得票数 1

回答已采纳

1回答

在选择查询中插入计数n1和n2列

、

在尝试建立数据网格时，我想要显示项目的列表，并根据其其他属性(如颜色作为结果行)显示项目总数和拆分计数。我的桌子上有10把椅子，所以项目名称=“椅子”应该有三排，如下所述。

浏览 0提问于2013-12-05得票数 0

回答已采纳

1回答

高效地查找r中数据中不同行的列值计数

、、、

假设我有一个数据框架如下：1 "hi"1 "hi again"2 "hello"现在，我希望获得id列中每个不同值的计数。Freq1 "hi again" 2 2 "hello"

浏览 2提问于2015-06-19得票数 2

回答已采纳

2回答

pyspark数据帧中所有列的总计数为零

、、

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

2回答

如何在表格的每个单元格中拆分字符串后获得唯一值和计数

、

我有一个名为df的数据帧。我希望根据,对a、b和c列中的值进行字符串拆分，并获得每列的唯一元素列和这些唯一元素的计数，如下面的结果所示。我们如何在R中完成这项工作？谢谢你的帮助。

浏览 39提问于2019-01-24得票数 2

回答已采纳

1回答

我需要在上传之前保存视频

、、、、

我有一个应用程序，有可能录制视频和上传它。在我从UIImagePickerView获得视频后，我使用ASIHTTPRequest的PUT方法上传它。我的问题的最佳解决方案是什么？

浏览 0提问于2011-08-19得票数 0

回答已采纳

2回答

将单列拆分成四列，并计算R中重复的模式

、、

这个项目的目的是了解信息是如何在查看对象时获得的。想象一个对象有像a，b，c，d，e和f这样的元素。一个人可能看了a，然后转到b，以此类推。现在，我们希望绘制并了解此人如何在给定刺激的不同元素之间导航。我有在单个列中捕获此移动的数据，但我需要将其拆分为几列才能获得导航模式。请找到下面给出的示例。f e

浏览 18提问于2020-05-23得票数 2

回答已采纳

2回答

如何获取字符串，字符串计算R (TextMining)中数据帧中的整字

、、

我想要在数据帧中获取他们在r中计数的字符串数据集如下所示： No Str 1 "I like travelling in Australia." 2 "I like travelling is America1 1 travelling 1 1 in 1 1 Australia 1 2 I 1 2 like 1 2 to 1 2 travelling 1 2 in 1 2 America 1 我曾尝试使用拆分第一行

浏览 20提问于2020-10-11得票数 0

回答已采纳

1回答

通过筛选列值从单个数据帧创建多个.csv

、、、、

这是我的数据框架- 1 1/1/2015| g| 6| 6 1/14/2015| r| 0| 8 1/12015| t| 2| 我想获取列‘.csv’上的值并</

浏览 0提问于2016-11-18得票数 0

1回答

如何获取多个域的数据帧格式的ssl信息？

、、、、

如何在多个域的数据帧中获取这些统计数据。

浏览 17提问于2020-06-08得票数 1

回答已采纳

1回答

在Spark中对RDD排序

、、

我有一个数据集，列出了客户购买的一般项目。csv中的每条记录从左到右列出了客户购买的商品。Bicycle, Helmet, GlovesTelevision, Hat, Jumper, Playstation 5 我希望把它放在scala的RDD中，并对它们进行计数。第二行从csv中获取数据并将其放入rdd_1中。第三行执行平面映射，在逗号上拆分

浏览 26提问于2021-03-06得票数 0

回答已采纳

2回答

如果行计数值超过某个限制，是否将Gridview值拆分到具有相同标题的其他列中？

、、、、

我从SQL DB中获取数据，并在asp网页的Gridview中显示这些数据，现在我想根据行值将这些数据拆分到其他列中。对于Ex:我有两列，如雇员Id、雇员姓名。如果行值超过100，我希望将剩余数据显示到具有相同标题的其他列中。在这里，相同的标题意味着数据来自相同的表，我有这样的要求，如果行值超过100个计数，我想要显示到其他列。

浏览 2提问于2015-06-26得票数 0

1回答

将Pandas dataframe中的值拆分为to值，并为新值创建行

、

账单行数据量报告为一个值，但我知道55%的数据量来自源A，45%来自源B。我如何在Pandas数据帧中创建新行，以将行拆分为两行，每个源一行？我可以计算每个源的新体积值，并将其放入新列，但我不确定如何将这些值输入到新行中。源A应为计数的55%，源B应为计数的45%。

浏览 9提问于2019-03-28得票数 0

1回答

从存储在DataFrame中的列表中删除项

、、、

我还将术语频率以‘关键字’：频率格式存储在字典中。我的整个方法可能是不正确的--性能是一个很大的问题，df大约有35万行，"Body“列中的列表可能包含从几百到几千个不等的单词将所有数据存储在熊猫df而不是列表中的原因是，我希望保留ID列，这样以后我就可以将我的数据连接到我已经在广告上做的其他分析了。

浏览 1提问于2021-11-12得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将数据帧按所有列拆分并插入到数据帧列表中

统计pandas数据帧中子元素的出现次数

将数据帧导出到不同的CSV，每个CSV有1000行

select top 1* from C返回count size作为分区数* cosmosdb中的实际查询计数

如何显示我的文章创建的年份和月份(PHP，Yii2)？

分组记录后计数单词

在选择查询中插入计数n1和n2列

高效地查找r中数据中不同行的列值计数

pyspark数据帧中所有列的总计数为零

如何在表格的每个单元格中拆分字符串后获得唯一值和计数

我需要在上传之前保存视频

将单列拆分成四列，并计算R中重复的模式

如何获取字符串，字符串计算R (TextMining)中数据帧中的整字

通过筛选列值从单个数据帧创建多个.csv

如何获取多个域的数据帧格式的ssl信息？

在Spark中对RDD排序

如果行计数值超过某个限制，是否将Gridview值拆分到具有相同标题的其他列中？

将Pandas dataframe中的值拆分为to值，并为新值创建行

从存储在DataFrame中的列表中删除项

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐