pandas 计算行数_在Pandas中使用条件计算行数_python计算csv pandas中的行数 - 腾讯云开发者社区

scala、apache-spark

我正在运行一个简单的示例:通过一个文本文件生成一个RDD，并过滤所有包含单词"pandas“的行。在此之后，我使用一个操作来计算文件中实际包含该单词的行数。如果我只是简单地计算文件的总行数，一切正常，但是如果我应用过滤器转换，然后尝试计算元素的数量，它不会完成执行。 val lines = sc.textFile("/home&#x

浏览 0提问于2019-08-19得票数 0

2回答

对pandas groupby对象中的值进行有条件的计数

python、pandas、dataframe

我有一个pandas.core.groupby.DataFrameGroupBy对象，其中我试图计算TOTAL_FLOOR_AREA的值为> 30的行数。我可以使用以下命令计算groupby对象中每个数据帧的行数：但是如何有条件地计算T

浏览 4提问于2017-08-16得票数 4

回答已采纳

1回答

如何用python创建excel的数据透视表？

python、python-3.x、excel、pandas、openpyxl

我遇到了使用pandas来透视表格的多种方法，但所有这些都是实际的透视，而不是excel的透视。我需要的数据透视表仍然引用其他工作表的数据，并有筛选器在顶部的透视表与所有excel的透视表功能。

浏览 15提问于2020-09-04得票数 0

2回答

计算MultiIndex DataFrame的平均值

python、pandas、dataframe

我必须根据该级别的行数来计算MultiIndex DataFrame的平均值。基本上，我必须对最后一列中的值求和，然后除以每个SKU_ID索引的每月行数，从而求出这些值的平均值。我如何在Pandas中继续？谢谢

浏览 0提问于2019-04-04得票数 0

1回答

执行kmeans聚类时的Sklearn inifinity值

python、scikit-learn

我正在尝试通过以下方式聚集超过200k个点：km.fit_transform(ends)所以矩阵的维数是200kX2 X = self._check_fit_data(X)ValueError: Input co

浏览 0提问于2015-09-28得票数 2

2回答

有没有办法跳过pandas中的行，直到csv显示"Flight Table"？

python、pandas、csv

N11682,aircraft,C172,,Cessna,C172SP,airplane,airplane_single_engine_land,fixed_tricycle,Piston,false,false,false,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Flights Table,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, Date,AircraftID,From,To,Route,T

浏览 0提问于2020-11-08得票数 0

1回答

使用dask计算移动平均值

python、pandas、dask

我正在尝试计算一个非常大的数据集的移动平均值。行数约为30M。为了说明使用pandas，如下所示 df = pd.DataFrame({'cust_id':['a', 'a', 'a', 'b', 'b'], 'sales': [100, 200, 300, 400mov_avg'] = df.groupby("cust_id")["sales"].ap

浏览 14提问于2020-01-16得票数 0

1回答

并行化pandas函数pd.concat

python、pandas、multithreading、parallel-processing

我有一个名为df_list的巨大数据帧列表(有一些不同的列和一些公共列)，我希望将它们合并到一个大数据帧中。我尝试过以下几种方法：虽然这在单个内核上花费了太多的时间。我在48小时后就把剧本给杀了。您如何将此过程并行化以使用我的所有内核，或者重写代码以使其更快

浏览 2提问于2019-12-29得票数 1

2回答

在Pandas的Dataframe中导入和打印Json对象

python、pandas、dataframe

我有一个json文件，看上去像图片中的那个。我如何进口和打印所有的数量和价格的潘达？如何打印购买和销售的所有数量之和？如何打印值大于x的所有数量之和?例如: sum (Qty> 5)在原始格式中，数据如下 {"success":true,"message":"","result":{"buy":[{"Quantity":199538.30948659,"Rate":0.00000970},{"Quantity":62142.31715449,"

浏览 2提问于2017-11-10得票数 1

回答已采纳

1回答

在Pandas中使用条件计算行数

python、pandas、count、rows

我的pandas数据帧如下所示： a b c d e y 0 3 8 9 0 z 2 3 5 0 1 我想计算value != 0的行数。

浏览 16提问于2019-02-17得票数 0

回答已采纳

1回答

计算pandas中两列的行数

python、python-3.x、pandas、dataframe

340 5 45 80 我想计算一下我们有多少产品至少有一个竞争对手的价格使用熊猫

浏览 19提问于2020-09-19得票数 0

回答已采纳

2回答

python计算csv pandas中的行数

python、pandas、csv

rgb is_trans1 0 Black 05131D f 2 1 Blue 0055BF t 你如何计算有多少餐饮店

浏览 44提问于2019-03-04得票数 1

回答已采纳

1回答

如何在Pandas中执行COUNTIFS

python、pandas

有没有办法在pandas数据框中添加一列，以复制excel COUNTIFS公式来计算满足多个条件的行数？我目前有一个基本的2列数据帧，其中有小时列和符号列。我想要一个第三列，它运行数据帧的长度，并计算小时+符号对出现的次数。

浏览 63提问于2021-10-26得票数 0

回答已采纳

1回答

计算每个唯一行值的重复行数

python、pandas、dataframe

我有下面的pandas DataFrame1 s 52 s 53 e 6我需要计算a的每个唯一值的重复行数，以获得以下结果

浏览 11提问于2016-02-26得票数 1

回答已采纳

1回答

具有给定术语的文档的PySpark HashingTF计数

dataframe、pyspark、tf-idf

我想要计算出现各种单词的行数-本质上是出现“术语”的“文档”的数量-以及相关的计数，如最频繁的单词，具有最频繁单词的行(或称为文档)。# As an example create a Pandas-dfpandas_df = pd.DataFrame({"text": ["The cat jumpedpyspark.sql import SparkSession spark = SparkSession.builder.getOrCr

浏览 25提问于2021-08-31得票数 0

回答已采纳

1回答

为什么dataframe会变成一个系列？

python、pandas、dataframe、series

为什么下面的函数groupby().size()将dataframe更改为一个系列？在第一行中，我返回info()函数的结果，但在第三行，我收到一个错误。“串联”对象没有属性'info‘。test = df_injury_record.groupby(["Surface"]).size()当我想要将它放在dataframe中时，这个函数是什么样子的？

浏览 0提问于2020-01-25得票数 0

回答已采纳

1回答

在Python中使用pandas基于条件进行计数

python、pandas

我使用的是pandas，我想要计算符合特定条件的行数，但我想要在不同的级别进行计数。因此，我想要计算有多少行的Method为Basic，有多少行的Advanced，然后依次计算这些Basic中有多少行的值为CR、CD或PD。0 0 0PD 0 1 1 我从以下几个方面开始： import pandasvalues.append(sum(g['Metho

浏览 33提问于2019-03-20得票数 0

回答已采纳

1回答

方法来压缩数据集的行。

python、pandas、pyspark

我正在处理星火上的大型数据集，然后转换为Pandas。我有一个文件，它只有2或3个特性，但有很多行。我需要保留尽可能多的信息，但当我转换为Pandas时，行数会导致内存问题。我的一个想法是将特征分割成小范围，然后计算每个范围内的记录数。例如：(0.01<x<0.02，count = 12)，然后对范围的所有组合重复此操作

浏览 1提问于2022-10-04得票数 0

回答已采纳

1回答

如何对特定列中的每个数字进行数学计算

python、numpy、pandas、math、exp

我在Python中使用pandas.read_excel()导入了一个Excel文件。import math rchdecay=N_DATA

浏览 0提问于2016-06-02得票数 1

回答已采纳

1回答

使用pandas设置页眉

python、pandas

我有一些txt文件，它们以很多废话开头，20到30行之后有用的部分就开始了。我想用数字前的最后一行作为我的标题。我知道如果我知道确切的行号，我可以将它设置为我的头文件(使用pd.read_csv)，但是对于每个文件，这个数字是不同的(正如我所说的，它在20到30之间)。我知道我要找的那一行是以“潜力”开头的。有没有什么简单的方法可以使用pd.read_csv并从头开始设置头部。

浏览 22提问于2019-05-07得票数 2

点击加载更多