如何通过梳理value_counts()_如何仅对某些值使用value_counts()？_pandas:如何让value_counts()超过阈值 - 腾讯云开发者社区

python、pandas

很抱歉提了个冗长的问题。我一定要澄清。我所拥有的是一个看起来有点像这样的数据文件: In 1: df Out1 likes num_comments words 0 324 1032 song 1 123 4399 bird 2 500 4993 pie 3 453 2003 bird 4 34 132 lucky ... ... 943 129 259 bird 944 5

浏览 4提问于2022-08-21得票数 0

2回答

如何在使用count_values()时获取计数值的名称？

python、python-3.x、pandas

我有个数据： import pandas as pd df = pd.DataFrame({'letter': ['A','A','B','B','C','C'], 'value':[ 1, 2, 3, 3, 7, 5], 'state':['CA','WA','WA','WA','CA

浏览 0提问于2020-07-08得票数 0

回答已采纳

3回答

假设我有以下数据。 import pandas as pd data = { 'home': ['team1', 'team2', 'team3', 'team2'], 'away': ['team2', 'team3', 'team1', 'team1'] } df = pd.DataFrame(data) 如何计算每个元素(团队)在两列中出现的时间？预期结果是 team1 3 team2 3 team3

浏览 10提问于2021-12-13得票数 2

回答已采纳

2回答

在单个DataFrame列python/大熊猫中按逗号分隔的值

python、pandas、dataframe、pandas-groupby

举个例子，假设我有一只蟒蛇熊猫DataFrame，如下所示： # PERSON THINGS 0 Joe Candy Corn, Popsicles 1 Jane Popsicles 2 John Candy Corn, Ice Packs 3 Lefty Ice Packs, Hot Dogs 我想使用熊猫群功能来获得以下输出： THINGS COUNT Candy Corn 2 Popsicles 2 Ice Packs 2 Hot Dogs 1 我通常理解以下groupby命令： df.groupby([&

浏览 1提问于2018-06-28得票数 3

回答已采纳

1回答

大熊猫资料发生的统计

python、pandas、dataframe

在执行groupby之后，我的数据集看起来就像这样。如何将第3栏中的共同制度相加？

浏览 5提问于2022-06-23得票数 -1

2回答

重命名小于模式计数0.5%的分类变量的类别，Value_counts()

python、pandas、dataframe

我有一个非常大的df，很多行和列。如果分类变量的类别小于模式计数的0.5%，我想将其重命名为"other“。我知道df[colname].value_counts(normalize=True)给了我所有类别的分布。如何提取小于0.5%的模式，以及如何将其重命名为other？ apple large 100 medium 50 small 3 desired output apple large 100 medium 50 other 3

浏览 0提问于2021-03-22得票数 0

2回答

如何使用https从Geoserver加载地图？

java、tomcat、geoserver

如何将Geoserver配置为仅从https地址加载？我一直在梳理网络，但找不到任何解决方案。

浏览 2提问于2015-01-23得票数 4

回答已采纳

2回答

矩阵库中数列观测量的数值范畴数据的基本图

python、pandas、matplotlib、data-visualization、seaborn

我有一个数据中的数字分类数据，我想按值按升序排列图和顺序。我可以很容易地在海上做这件事，但我想不出如何在熊猫或matplotlib中订购。这是代码，就像我说的，海上的地块是正确的，但是熊猫的地块不是。 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.DataFrame({ 'category':['blue','green','red','blue

浏览 2提问于2019-09-28得票数 0

回答已采纳

1回答

对具有低值计数的唯一值进行分组

python

我的数据框包含超过40个特定属性的唯一值。我想对这些数据做一些可视化处理，但拟合所有40个点是具有挑战性的。使用wine['country'].value_counts()，我可以看到每个唯一值的频率。例如，当我要创建条形图时，我希望将值计数小于100的任何唯一值组合在一起，以便在可视化中创建自己的条形图(并将其称为“rest”或“other”)。有什么办法做到这一点吗？

浏览 0提问于2020-08-09得票数 0

2回答

pandas:如何让value_counts()超过阈值

python-3.x、pandas、dataframe

如何使value_counts高于阈值？我试过了 df[df[col].value_counts(dropna=False) > 3] 来获得所有大于3的计数，但我得到的是 IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match). 有什么提示吗？谢谢

浏览 28提问于2021-04-08得票数 1

回答已采纳

5回答

在Pandas value_counts()中提取值

python、pandas、dataframe、series

假设我们使用了熊猫dataframe[column].value_counts()，它输出： apple 5 sausage 2 banana 2 cheese 1 如何按上面所示的顺序从max到min提取值？例如：[apple,sausage,banana,cheese]

浏览 8提问于2016-02-20得票数 98

回答已采纳

2回答

如何丢弃小于5%的所有数据熊猫的值？

pandas、dataframe

我有以下值。他们中的一些人只提供一个。如何丢弃低于总值5%的值？例如，值PIP1只表示一个值，而且它显然不到所有值的5%。如何删除所有相似的值？并且可能针对所有列 ?

浏览 25提问于2020-12-06得票数 1

2回答

访问pandas系列的索引

python、dictionary、pandas、series

我正在尝试确定熊猫数据帧中哪个单词计数最多(在我的代码中是df_temp)。我还有这个： l = df_temp['word'].count_values() 那么，l显然是一个pandas序列，其中第一行指向df_temp'word‘中计数最多的索引(在我的例子中是计数最多的单词)。虽然我可以在我的控制台中看到这个词，但我不能正确地获取它。到目前为止，我找到的唯一方法是将其转换为字典，这样我就可以： dl = dict(l) 然后，我可以轻松地检索排序字典的index...after。显然，这可以完成工作，但我非常确定您有一个更聪明的解决方案，因为这个解决方案非常肮

浏览 0提问于2015-11-05得票数 2

回答已采纳

1回答

一个系列中包含子字符串的字符串的聚合计数

pandas

请考虑以下数据： In [2]: import pandas as pd In [3]: df1 = pd.DataFrame({'col1':['John', 'Felix', 'Vicki', 'Sam', 'Jack', 'Rodney'], 'col2': ['Likes tea with cookies', 'Likes tea with croissants','Likes coffee with churros

浏览 3提问于2019-02-27得票数 1

回答已采纳

1回答

如何在Python中测试csv文件的特定列中的条件

python、pandas、dataframe、csv

我已经知道了如何遍历具有n列的csv文件中的特定列。但现在我想要创建一个条件，但我不确定如何创建。所讨论的列是一周中的某几天(星期一、星期二等)。我想写代码，以便我的迭代计算所有的星期一，所有的星期二，等等。这是我写的，我得到了一个语法错误。 mon = 0 # print (df) days_week = df.iloc[4:,2] # print(days_week) for i in days_week: if i == "MONDAY" mon+=1 当前此特定列的数据类型为“object”。所以我想我需要把它改成字符串？

浏览 15提问于2020-06-29得票数 0

回答已采纳

2回答

计算Dataframe中的特定值

python、python-3.x、pandas

如果我在数据帧中有一列，并且该列包含两个可能的分类变量，我如何计算每个变量出现的次数？那么，例如，我如何计算研究中有多少参与者是男性或女性？我尝试过value_counts，groupby，len等，但似乎都搞错了。谢谢

浏览 0提问于2018-07-03得票数 0

1回答

(使用pandas解决SQL问题)从给定的pandas df中，找到朋友最多和朋友数量最多的人

python-3.x、pandas

从下面给定的df， request_accepted_short = pd.DataFrame({'requester_id':[1,1,2,3], 'accepter_id':[2,3,3,4], 'accept_date':['2016_06-03','2016_06-08','2016_06-08','2016_06-09']}) 我想要找到拥有

浏览 14提问于2019-04-29得票数 1

回答已采纳

2回答

如何提取列的唯一值及其计数并用索引键存储在数据帧中

pandas、data-science

我对熊猫很陌生，我有一个简单的问题：如何提取列的唯一值及其计数并用索引键存储在数据帧中我试图： df = df1['Genre'].value_counts() 我得到了一个系列，但我不知道如何将它转换为数据帧对象。

浏览 0提问于2018-05-27得票数 0

回答已采纳

17回答

熊猫获得列中最常见的值

python、pandas、dataframe

我有这个数据： 0 name data 1 alex asd 2 helen sdd 3 alex dss 4 helen sdsd 5 john sdadd 因此，我试图获取最常见的值(在本例中是它的值)，所以我所做的是： dataframe['name'].value_counts().idxmax() 但是它只返回值：Alex，即使它海伦也出现了两次。

浏览 0提问于2018-02-02得票数 95

回答已采纳

1回答

大熊猫count_value(0)与count_value(1)的差异

python、pandas

请求:data‘data’..value_count(0) 输出： 0 7963 1 2037 请求:data‘data’..value_count(1) 输出： 0 79.63 1 20.37 请解释一下value_counts的参数1，0是如何工作的？

浏览 2提问于2020-12-14得票数 0

回答已采纳

1回答

在python中向dataframe添加百分比列

python、pandas、dataframe

对不起，我对蟒蛇很陌生。我有一个数据集“奥运会”：数据集和列 olympics.isnull().sum ID 0 Name 0 Sex 0 Age 9315 Height 58814 Weight 61527 Team 0 NOC 0 Games 0 Year 0 Season 0 City 0 Sport 0 Event 0 Medal

浏览 3提问于2022-06-13得票数 0

回答已采纳

1回答

属性的频率

python、pandas

使用Python和Pandas:对于给定的数据集，如何找到特定属性的编号？例如，我有超过600行的16列数据。我想知道在A5列中有多少属性"g“。我已经附加了我找到的代码，但它没有给出正确的值或使用特定的列。 df = df['g'].value_counts().reset_index() df.rows = ['g', 'count'] print(df)

浏览 4提问于2017-11-29得票数 0

6回答

AttributeError：'DataFrame‘对象没有属性

python、pandas、attributeerror

当我试图在ipython...beginner中与熊猫一起运行这个文件时，我总是得到不同的属性错误，所以我可能遗漏了什么代码： from pandas import Series, DataFrame import pandas as pd import json nan=float('NaN') data = [] with open('file.json') as f: for line in f: data.append(json.loads(line)) df = DataFrame(data, columns=['accept

浏览 5提问于2013-10-15得票数 41

回答已采纳

1回答

计数唯一值单列pandas

pandas、count、pandas-groupby

嗨，我有下面的数据框，我想计算一下每年重复的次数 df = pd.DataFrame({'year':[1958,1963,1958,1963],'title':['a','g','z','e']}) 我如何按年分组并计算每年有多少次？我将使用count创建一个额外的列。

浏览 37提问于2020-12-05得票数 0

3回答

如何从Pandas value_counts()结果中提取值

python、pandas

在对数据框某列中的唯一字符串进行df.['ColumnName'].value_counts()计数后，我得到了以下格式的结果： a 4 b 2 c 5 Name: ColumnName, dtype: int64 如何从这些结果中提取值？例如，我怎样才能得到'b‘或2？

浏览 0提问于2021-05-13得票数 0

2回答

有没有一种简洁的方法来对数据帧中出现的字符串进行计数？

python、pandas、cumsum

我有一个按时间顺序排列的df (从旧到新)的UFC战斗。每一行都包含两个战斗机。如何创建两个新列： col_a = R_fighter存在的战斗次数的累积和，col_b = B_fighter存在的战斗次数的累积和例如，在df的第1000行，我想要一个从第0行到第999行的R_fighter在数据帧中出现的次数的累计计数。我正在努力在不使用某种for循环的情况下理解这一点。

浏览 0提问于2020-06-14得票数 1

2回答

Matplotlib图首先n个入口槽value_counts()

python、pandas、matplotlib

phones['phone_brand'].value_counts().plot('bar') plt.show() 我只想画出前20条。在我看来有两种可能性。我只做前20个条目的计数，或者我只做前20个条目的情节。我只需要整个名单的前20个条目。谢谢你的灵感！

浏览 3提问于2017-10-28得票数 1

回答已采纳

1回答

计算Pandas列中特定字符串的数量

python、pandas

如何计算pandas列中特定字符串的数量？我想得到它在pandas列中字符串总数中所占的百分比。

浏览 2提问于2017-12-22得票数 0

回答已采纳

1回答

在Python机器学习中，只有标签为true时，如何计算特征百分比？

python、pandas、machine-learning、count、jupyter

我正在使用Jupyter来学习机器学习。我想知道只有" like“列是1的时候，如何计算特征百分比(Style，Typo，Layout百分比)？

浏览 22提问于2020-02-04得票数 0

回答已采纳

1回答

如何用项目计数填充列表/字典？

python、pandas、dataframe

处理一个计算DataFrame列中类似项的函数。下面是我到目前为止的情况，但它没有正常工作。任何帮助都将不胜感激。 brands = {'BAI': 0, 'SMARTWATER': 0, 'SPARKLING ICE': 0, 'ZICO': 0, 'IZZE': 0, 'VITA COCO': 0, 'PERRIER': 0, 'C20': 0, 'HIBALL ENERGY': 0, 'TASTE NIRVANA': 0

浏览 1提问于2019-12-27得票数 0

回答已采纳

3回答

用“其他”python重命名频率较低的类别。

python、pandas、dataframe、counter、categorical-data

在我的dataframe中，我有超过100个不同类别的分类列。我想按最频繁的分类来排序。我保留前9个最频繁的类别和频率较低的类别自动重命名为: OTHER：示例：这里是我的df： print(df) Employee_number Jobrol 0 1 Sales Executive 1 2 Research Scientist 2 3 Laboratory Technician 3 4

浏览 0提问于2018-12-06得票数 7

回答已采纳

1回答

如何用Matplotlib在DataSet中以字符串作为值绘制两列？

pandas、matplotlib、plot、dataset

我有以下数据集，我想要创建一个地块，与列进行比较。 import pandas as pd import matplotlib.pyplot as plt import numpy as np ds=pd.read_csv('h-t-t-p-:bit.ly/uforeports') #My DataSet ds.head(5) # Only the fist 5 rows to show ds1= ds.head(4).drop(['Colors Reported','State'],axis=1) # Droping of unnecess

浏览 2提问于2020-09-25得票数 0

1回答

如何从列表中值所在的pandas列中提取唯一值

python、pandas、list、dataframe、unique

我想从熊猫数据框中的城市列中提取独特的城市。城市列具有列表中的值。如何提取城市频率，如下所示： Lahore 3 Karachi 2 Sydney 1 等。示例数据帧： Name Age City a jack 34 [Sydney,Delhi] b Riti 31 [Lahore,Delhi] c Aadi 16 [New York, Karachi, Lahore] d Mohit 32 [Peshawar,Delhi, Karachi] 谢谢

浏览 21提问于2021-01-23得票数 0

回答已采纳

1回答

如何将可迭代的值转换为变量的名称？

python、pandas

我有一个DataFrame列名称的列表，我想为一些特定的情况创建一些单独的DataFrames，我想知道是否可以使用iterable的值来命名变量：我的代码： for label in labels_cols: label+"_df" = train_df[train_df[label]== 1]['text_len'].value_counts().sort_index()

浏览 2提问于2021-05-18得票数 1

回答已采纳

1回答

对列中的行进行分组和降序

python

enter image description here 我不确定如何正确地问这个问题，但是我如何找到参与者最多的国家(“团队”)。从最多的国家到最少的国家。例如，美国1000，中国999等。

浏览 19提问于2021-09-04得票数 0

回答已采纳

1回答

如何在绘图/图表中显示同一列的不同值

python、matplotlib、jupyter-notebook

列类对值有两个选项，要么是'b‘，要么's’。我试图显示一个图表，显示多少是'b‘和多少是's’。当它们都在同一栏中时，我不知道如何做到这一点。当前的代码显示了散点图，但我想使用列“class”中的数据。 import pandas as pd import matplotlib.pylab as plt import numpy as np #df = df.groupby('class')['class'].count() #print(df) df = pd.DataFrame(np.random.randint(0,

浏览 3提问于2022-01-07得票数 2

1回答

返回某列中select值的百分比计数

python、pandas、dataframe

我有当前的代码，然后是一个打印输出，它是一个系列，如下所示 shapes = ['triangle','circle','square'] max_shape = None max_percent = None for shape in shapes: df_overall = df[(df['Shape']== shape)] num_overall = df_overall.shape[0] shape_df = df num_total = shape_df.shape[0] per

浏览 14提问于2020-01-11得票数 2

回答已采纳

1回答

熊猫-用确定的值来保持一排一排，其余的都掉下来。

python、pandas、dataframe、numpy、data-science

因此，我有这样一个数据框架(重要的一列是第三列)： | ABC | DEF | fruit | ---------------------------- 1 | 12 | LO | banana 2 | 45 | KA | orange 3 | 65 | JU | banana 4 | 25 | UY | grape 5 | 23 | TE | apple 6 | 28 | YT | orange 7 | 78 | TR | melon 我希望保留有5个最常见的水果的行，然后删除其

浏览 1提问于2022-02-18得票数 1

回答已采纳

1回答

在Swift中寻找等价物"exit“

swift

我尝试将exit(0)放在一个小的测试(命令行)程序中。Xcode给出了一条错误消息，声明为Use of unresolved identifier 'exit'。这让我感到困惑，因为似乎展示了exit()的工作。在梳理"The Swift Programming Language“之后，我找不到任何提到exit关键字/命令的地方。那么，如何在Swift中显式停止执行呢？

浏览 2提问于2014-06-08得票数 32

回答已采纳

2回答

如何绘制pandas栏目的频数？

python、pandas

我有一个像这样的熊猫数据框架： Year Winner 4 1954 Germany 9 1974 Germany 13 1990 Germany 19 2014 Germany 5 1958 Brazil 6 1962 Brazil 8 1970 Brazil 14 1994 Brazil 16 2002 Brazil 如何绘制列优胜者的频率计数，使y轴有频率，x轴有国家名称？我试过了： import numpy as np import pandas as pd df.groupby('Winner'

浏览 20提问于2018-12-28得票数 14

回答已采纳

3回答

从pandas.dataframe中删除低频值

python、pandas

如何从pandas.DataFrame中的列中删除很少发生的值，即低频值？示例： In [4]: df[col_1].value_counts() Out[4]: 0 189096 1 110500 2 77218 3 61372 ... 2065 1 2067 1 1569 1 dtype: int64 因此，我的问题是:如何删除2065, 2067,

浏览 5提问于2015-09-10得票数 30

回答已采纳

1回答

使用value_counts和python中的多列对百分比进行分组

python、pandas、likert

我想使用value_counts(normalize=True)创建一个跨多个列的分组百分比表。除了添加"normalize=True“部分之外，我想要执行类似于下面的操作，但不确定如何使用groupby.agg来执行此操作。对于如何在不添加更多代码行的情况下做到这一点，有什么想法吗？我的实际数据有很多列，除了分组列之外，每个列的比例都是1-5。示例如下： df = pd.DataFrame({'Country': ['FR', 'FR', 'GER','GER'], &#

浏览 58提问于2021-08-31得票数 1

2回答

如何在同一标签下绘制多列条形图

python、pandas、numpy、matplotlib、seaborn

我希望绘制我的dataframe，其中包含许多列，每个列都带有"TRUE“或"FALSE”标签(从Excel导入)。类似情况的一个小例子是： df = pd.DataFrame({"a":["TRUE","FALSE","FALSE","TRUE","FALSE"], "b":["TRUE","TRUE","FALSE","TRUE","TRUE"], "c":["

浏览 4提问于2019-10-09得票数 1

回答已采纳

2回答

取最大的5，和/数其余的熊猫

python、python-3.x、pandas、count、series

浏览 0提问于2019-01-23得票数 3

回答已采纳

1回答

用数据框架对大熊猫进行概率检验

python、pandas、probability

我想使用循环预先形成一个大型数据集的概率测试。我知道如何计算，但我想把它作为一个测试。(就像一个随机的“抛硬币”测试)这个假df： df=pd.DataFrame([ ['Alex',12, 'Apple'],['Bob',10, 'Banana'],['Clark',13, 'Citrus'], ['Diana', 11, 'Banana'], ['Elisa', 13, 'Apple'] ],columns=['Name&

浏览 0提问于2019-03-13得票数 0

回答已采纳

2回答

关于数据中重复值的计数

python、database、dataframe、duplicates、analysis

如何在dataframe中获取一个特定列的所有重复值？我只想检查一列上的值，但它是用表或数据输出的。我要计算每个值被重复的次数。

浏览 10提问于2022-10-01得票数 0

3回答

如何计算数据行中元素的频率？

python、python-3.x、pandas

我的数据框架如下所示 df = pd.DataFrame([['pqr', 'abc', 'pqr', 'NULL', 'NULL']], columns=['col1', 'col2', 'col3', 'col4', 'col5']) col1 col2 col3 col4 col5 0 pqr abc pqr NULL NULL 期望产出： code count pqr

浏览 2提问于2021-04-08得票数 2

回答已采纳

1回答

在pandas dataframe中对列进行排序

python、pandas、pandas-groupby

我需要创建一个dataframe，过滤掉国籍列中列出频率最高的五个国家和它们被列出的总次数。我一直在尝试使用groupby，但是没有成功。我用过的代码 df.groupby(['Nationality']).sum() 我还需要确定参与该计划的人中至少有一个推荐的百分比是多少。不过，我也不确定这方面的代码。 ?

浏览 14提问于2021-10-21得票数 0

回答已采纳

3回答

使用dataframe pandas中的value_counts创建新列

python、pandas

我正在使用下面的公式来获取值计数。数据帧中的列： new_data = df['item'].value_counts() 给出了以下结果 Apples 3 Green bananas 2 Bananas 1 Oranges 1 我想要的是获得输出的每一个项目计数在新的列，如下面的excel例子 ? 任何帮助或指导我们都将不胜感激。谢谢

浏览 123提问于2021-09-23得票数 2

回答已采纳

3回答