Pandas:如果字符串存在于多个列中的任何一列中，我想对计数求和，并将此计数与搜索到的术语添加到另一个数据帧中 - 腾讯云开发者社区

python、pandas、dataframe、lambda、apply

我有一个大约360列的Pandas数据框。我希望根据在其余列中有多少列的值大于0的计数，将另一列添加到另一帧中。我的所有列的类型都是浮动64。如果这是我的原始数据帧 column A column B column C ...............Column Z 0 1.5 6.77 3.33 3.5 4.5 0 0 0 0 0.98 0 . . . 2.35 4.32

浏览 23提问于2021-02-26得票数 0

5回答

ValueError:不能设置没有定义索引的帧，也不能设置不能转换为级数的值

python

我在python 3.X中使用了Pandas 0.20.3，我想从另一个熊猫数据框架中添加一列到熊猫数据框架中。这两个数据帧都包含51行。因此，我使用了以下代码： class_df['phone']=group['phone'].values 我收到以下错误消息： ValueError: Cannot set a frame with no defined index and a value that cannot be converted to a Series class_df.dtypes给了我： Group_ID object YEAR

浏览 1提问于2018-01-17得票数 45

回答已采纳

2回答

从引号中解开.csv行

python、pandas、csv

.csv文件如下所示 col1, col2, col3 "a, b, c" "d, e, f" 我想解开引号中的行以正确读取pandas/Python中的文件。如R中的重复问题所述，可以读取.csv数据两次: 1)展开辅助数据帧的第一列中的数据，以及2)调用辅助数据帧的第一列上的读取函数。对熊猫来说，最优雅的方式是什么？

浏览 0提问于2018-12-15得票数 1

3回答

COUNTIF遇到DataTypes问题

excel、excel-formula

基本上，我想搜索2列。如果任何列中的任何数字是1，我要将其加起来。这是我的公式： COUNTIF(('Background data'!$A:$A,'Background data'!B:B), 1). 但是，当我应用它时，我会收到一个错误的信息：“公式中使用的值是错误的数据类型”。为了解决这个问题，我转到背景数据选项卡，将所有列设置为数字数据类型将当前正在处理的选项卡中的所有列设置为数字数据类型。用A列和B列分别测试countif公式，然后我不会收到错误。这就得出结论，我的列是正确的数据类型。我猜我得到这个错误是因为我的公式中有

浏览 1提问于2015-10-26得票数 0

回答已采纳

2回答

如何在列求和时忽略pandas中缺少的键

python、pandas

我有一个包含单词嵌入的pandas数据帧。单词是列名。为了得到句子的最终嵌入，我这样做： st = ['some','random','text'] a = df[st].sum(axis=1) 当所有术语都出现在数据帧中时，这种方法效果很好。但是，当数据帧中不存在该列时，它会引发一个键错误。目前，我对每一项都进行了循环，并进行了try操作。我想避免循环，在一行中做事情。熊猫有没有提供同样的选择。

浏览 14提问于2019-10-25得票数 1

2回答

pyspark数据帧中所有列的总计数为零

python、dataframe、pyspark

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

1回答

Python Pandas识别错误数据

python、pandas、csv

我有一个用逗号分隔的csv文件，每行有215列。文件非常大，我使用pandas dataframe pd.read_csv()和块来读取数据。文件中的一行有214列，而不是215列，但dataframe读取数据时将NaN应用于最后一列。有没有办法在pandas dataframe中标识此行，因为我更喜欢dataframe而不是csv_reader。注意:最后一列也可以为null，因此按等于null的最后一列过滤数据帧将不起作用

浏览 19提问于2020-09-30得票数 0

1回答

对每列执行操作

python

如何使用循环遍历列，将相同的函数应用于pandas数据帧中的每一列？例如，下面的代码对“Cat1”列进行规范化。 s['Cat1'] = (s.Cat1-s.Cat1.min())/(s.Cat1.max()-s.Cat1.min()) 如何对此代码进行扩展，以便将规范化应用于Cat1...Cat50？

浏览 0提问于2015-04-08得票数 0

1回答

对查询CakePHP中的数值进行计数

cakephp、cakephp-1.3

我尝试根据文档计算CakePHP中的数值。不管我怎么尝试，我只能得到这一列的行数，而不是数值的总和。我的文章模型中的查询：我尝试统计我的数据库中所有文章的点击量。hitcount是一个整型字段： $total_articles = $this->find('count', array('fields' => 'Article.hitcount')); //返回3，数据库总行数我尝试计算来自特定用户的点击次数。 $hitcountUser = $this->find('count', array('f

浏览 1提问于2011-09-19得票数 0

2回答

将重复行从列的子集移到Python中的另一个数据帧

python、pandas

使用Python和Pandas，我希望找到数据帧中所有具有重复行的列，并将它们移动到另一个数据框架中。例如，我可能有： cats, tigers, 3.5, 1, cars, 2, 5 cats, tigers, 3.5, 6, 7.2, 22.6, 5 cats, tigers, 3.5, test, 2.6, 99, 52.3 我想要猫，老虎，3.5在一个数据帧中 cats, tigers, 3.5 在另一个数据框架中，我想 1, cars, 2, 5 6, 7.2, 22.6, 5 test, 2.6, 99, 52.3 代码应该检查每一列是否重复行，并且只删除在所有行

浏览 2提问于2019-10-21得票数 0

回答已采纳

1回答

Python判断每一行是否包含特定的单词

python

我想判断每一行是否包含一些特定的单词，如价格，键，面积，所以一行包含其中一个单词，on.If列starnum将是1。如果一行包含其中两个单词，则starnum列将是2。我尝试了下面的代码，但得到结果的速度非常慢。数据超过9万行。那么我该如何改进我的代码呢？ import pandas as pd import numpy as np io=r'D:/test.xlsx' data1=pd.read_excel(io,sheet_name=0) data1['starnum']=0 l=len(data1) print (l) if data1['

浏览 45提问于2020-10-26得票数 0

1回答

Pandas数据帧多个数据库表

python、python-3.x、database、pandas、postgresql

我有一个API包装器，可以从特定的产品中提取数据。我面临着如何将json数据映射到数据库(postgresql)的问题。我已经阅读了Pandas dataframe，但我不确定这是不是正确的方法。我有几个问题需要帮助。 1)是否可以选择哪些行可以进入数据帧？ 2)数据帧内的每一行都需要插入到两个不同的数据库表中。我需要在TableA中插入10列，获得新插入行的id，然后在TableB中插入5列，包括返回的id。我该怎么做呢？ 3)是否可以为数据帧中的每一列指定数据类型？ 4)是否可以将列名称重命名为数据库字段名称？ 5)是否可以遍历特定的列并替换某些数据？对于我正在尝试实现的目标，有没有可以

浏览 14提问于2020-05-15得票数 1

回答已采纳

3回答

如何创建一个用随机字符串填充列的pandas数据帧？

python、pandas

我想创建一个包含2列x行的Pandas数据帧，其中包含随机字符串。我找到了生成带有随机int和随机字符串生成器的pandas数据帧的代码。我仍然没有看到一条清晰的路径来创建一个带有随机字符串的pandas数据框架。用于随机int数据帧的代码 import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) 随机字符串的代码 import string import random def id_gener

浏览 60提问于2019-06-01得票数 4

回答已采纳

4回答

比较两个dataframe列的匹配百分比

python、string、pandas、dataframe、compare

我想将一个列的数据帧与另一个多列的数据帧进行比较，并返回具有最大匹配百分比的列的标题。我在pandas中找不到任何匹配函数。第一个数据帧第一列： cars ---- swift maruti wagonor hyundai jeep 第一个数据帧第二列： bikes ----- RE Ninja Bajaj pulsar 单列数据帧： words --------- swift RE maruti waganor hyundai jeep bajaj 所需输出： 100% match header - cars

浏览 41提问于2019-06-17得票数 5

1回答

如何在熊猫数据帧中查找重复项

python、pandas

我想读取一个文件夹，里面有一些.csv文件，并找到重复的坐标。.csv如下所示： 0 0 0 1 1 0 1 2 1 1 0 0 0 1 2 ... 这里是第0行和第2行的副本，因为前3列(坐标)是相同的。我想也许在比较之前对数据帧进行排序会加快代码的速度。但是我不确定如何在python中正确地对它进行排序(我会按第一列进行排序。然后，对于第一列中相同的元素，第二列中的元素和第三列中的元素相同。因此，数据帧： 0 1 1 1 1 0 1 0 1 2 2 0 1 0 0 0 0 0 1 1 would look like this: 0 0 0 1 1 0 1 0 1 2 0 1 1

浏览 8提问于2019-06-07得票数 0

1回答

Pandas -如何在返回行时排除空白单元格

python、pandas、search、null、xlsx

我刚刚开始使用python和pandas，我想搜索一个数据帧，并根据药物名称返回一行，返回所有非空的列单元格。我有这个： import pandas as pd safety = pd.read_excel("safety.xlsx") searchterm = input("Enter drug name...") print (safety.loc[safety['Drug_name'] == searchterm]) 这将返回药物和所有列，甚至是空白列。例如，每一行是一种药物，每一列是一个标准，每种药物可以有一些标准的信息，但不是所有

浏览 24提问于2021-04-24得票数 0

回答已采纳

2回答

从R中的数据帧计算每分钟计数和

r、mongodb、statistics、rjson

我已经想了很长一段时间了，但一直没能做到。我发现了很多类似的问题，根本帮不上忙。我在R中有大约43000条数据帧记录，日期列采用“2011-11-1502:00:01”格式，另一列是计数。数据框架的结构： str(results) 'data.frame': 43070 obs. of 2 variables: $ dates: Factor w/ 43070 levels "2011-11-15 02:00:01",..: 1 2 3 4 5 6 7 8 9 10 ... $ count: num 1 2 1 1 1 1 2 3 1 2 ...

浏览 3提问于2014-10-08得票数 0

回答已采纳

1回答

使用FeatureUnion向来自不同列的countvectorizer添加功能

pandas、machine-learning、scikit-learn、random-forest、feature-extraction

我目前正在尝试添加一个额外的功能到一个countvectorizer矩阵，这个矩阵是用scikit-learn创建的。工作流程如下:我有一个dataframe，它包含一个包含文本的列和一个包含附加特性的列。我首先将我的数据分成训练数据帧和测试数据帧。然后，我在训练数据的文本列上应用countvectorizer。然后，我用计数分解器矩阵作为输入来拟合RandomForest分类器。我现在试图确定的是，我想使用矩阵和数据帧中另一列中的附加功能来运行RandomForest分类器。我怎样才能做到最好呢？我已经读到过scikit功能联合，但无法在我的数据框架中使用不同的列。下面是一个代码

浏览 22提问于2021-01-25得票数 0

回答已采纳

3回答

使用pandas数据帧的.loc函数

python、pandas、dataframe

我有一个pandas数据帧，它的一列是： a = [1,0,1,0,1,3,4,6,4,6] 现在我想创建另一个列，这样任何大于0小于5的值都被赋值为1，而rest被赋值为0，即： a = [1,0,1,0,1,3,4,6,4,6] b = [1,0,1,0,1,1,1,0,1,0] 现在我已经这样做了 dtaframe['b'] = dtaframe['a'].loc[0 < dtaframe['a'] < 5] = 1 dtaframe['b'] = dtaframe['a'].loc[dtafr

浏览 3提问于2016-08-13得票数 3

2回答

R dataframes:如何创建一个基于多个其他列计算值的新列？

假设我有一个数据帧，其中一列表示颜色，另一列表示形状。我想创建第三列，它是具有该颜色/形状组合的dataframe中的总行数。

浏览 0提问于2020-04-22得票数 0

2回答

pandas rank函数2列表示高值和低值

python、pandas

下面是组成一个包含两列的pandas数据帧的代码，一列名为data，另一列名为hours。data列是从-150到250的随机整数。hours列是从.5到15.5.的随机浮点数。 import random import numpy as np import pandas as pd data = np.random.randint(-150,250,size=200) df = pd.DataFrame(data, columns=['Data']) #generate random floats for df2 randomFloatList = [] # Set a

浏览 3提问于2021-01-08得票数 0

2回答

迭代期间的循环中断: Python，Pandas

python、pandas

这是我的代码，它搜索数据帧的一列，并在满足要求时返回值： import pandas as pd df=pd.read_csv("cl.csv") count=0 print(len(df.sl_no)) print(len(df.sn_compare)) for i in range(len(df.sn_compare)): if df.sn_compare[i] in df.sl_no: print(df.margin[i]) count=count+1 print(count) 输出： 8258 8258 0.036621541

浏览 3提问于2017-06-23得票数 1

回答已采纳

1回答

在OCaml中实现数据帧

ocaml、menhir

我一直在自学OCaml，它给我留下了深刻的印象。我想开发一个小的机器学习库用于实践，但我遇到了一个问题。在Python中，可以使用Pandas加载数据文件，然后将其传递到Scikit-Learn这样的库中。我想在OCaml中模拟同样的过程。然而，在OCaml中似乎没有任何数据框库。我检查了'ocaml-csv‘，但它似乎并没有真正做我想要的事情。我也研究了Haskell的‘Frame’，但它使用的是TemplateHaskell，但我相信，如果Pandas可以简单地将数据文件加载到内存中，而不需要编译时元编程，那么应该有一种更简单的方法来做同样的事情。有没有人知道数据框是如何在Pan

浏览 6提问于2015-03-22得票数 1

2回答

所有熊猫细胞的Lemmatization

python、pandas

我有一个熊猫数据帧。有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。如何使用nltk库有效地计算所有这些单词的引理？ import nltk nltk.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。我的数据看起来类似于： import pandas as pd data = [[['walked','am','stressed',

浏览 1提问于2017-11-30得票数 11

回答已采纳

1回答

Pandas DataFrame的Python CountVectorizer

pandas、countvectorizer

我有一个熊猫数据帧，它看起来如下所示： df.head() categorized.Hashtags 0 icietmaintenant supyoga standuppaddleportugal ... 1 instapaysage bretagne labellebretagne bretagne... 2 bretagne lescrepescestlavie quimper bzh labret... 3 bretagne mer paysdiroise magnifique phare

浏览 0提问于2020-03-02得票数 0

1回答

如何将数据插入到现有的dataframe中，根据条件替换

python、python-3.x、pandas、dataframe、conditional-statements

我希望将信息插入到现有的数据帧中，这个数据帧形状是2001行×13列，但是，只有第一列有信息。我还有12列，但是这些列与主数据框的维度不同，所以我想使用条件将这些额外的列插入到主数据框中。示例数据帧：在一个示例中，我希望将var列插入到2001×13数据帧中，使用日期作为条件，如果没有日期，则跳过行或简单地添加0。一般来说，我对python和编程都是新手。

浏览 4提问于2020-06-17得票数 0

1回答

Dataframe - Python中的Upsert函数

python-3.x、pandas、dataframe

我正在尝试使用与第一列相关的另一个数据帧来更新一个数据帧。如果第二个数据帧中有额外的行，则应将其插入第一个数据帧中。如果有一行在第一列中具有相同的数据，但在其他列中具有不同的数据，则应该更新该行。此外，应该删除第一列中没有值的行。使用的代码- df = df_1.combine_first(df_2)\ .reset_index()\ .reindex(columns=df_1.columns) df = df.drop_duplicates(subset='A', keep= 'last', inpl

浏览 0提问于2019-05-17得票数 0

4回答

如何查找具有一个或多个负值的pandas列

python、pandas

如果我想找出一个至少有一个零值的pandas数据帧中的所有特性，那么我可以使用以下命令。 df.isin([0]).sum() 这是简单而优雅的。找到具有负值的特征的等价物是什么？似乎没有简单的方法来找出pandas数据帧中至少有一个负值的所有列。你能帮帮忙吗？在此之前，非常感谢您。

浏览 0提问于2020-10-01得票数 0

1回答

如何在spark中使用pandas split-apply-combine风格策略和scala api？

pandas、scala、apache-spark、split-apply-combine

我有一个scala函数，它接受一个spark dataframe并返回一个单值，也就是说两个值。这个函数很复杂，使用在DataFrame类中定义的聚合，调用其他java库，并且不能用SQL表达。它需要整个数据帧的内容来进行计算，它不能一次添加一行并建立一个结果。我有一个大的dataframe，其中包含一个列，我想用它将dataframe分成小块，并对每个小块执行上述计算。然后，我想返回一个新的数据帧，其中包含每个组的一行和两列，一列包含groupby值，另一列包含结果。使用PandasUDF这将是一个相对简单的任务，但是我不知道如何在Scala中做到这一点。我尝试使用group by列对

浏览 28提问于2020-04-22得票数 0

1回答

如果描述在列表中包含短语，则Python Pandas求和分数

python、pandas

我有一个长长的短语列表(200,000+)： phrase_list = ['some word', 'another example', ...] 和一个两列的pandas数据帧，第一列中有一个描述，第二列中有一些分数 Description Score this sentence contains some word in it 6 some word is on my mind 3 repeat another example

浏览 2提问于2015-11-19得票数 4

1回答

在pandas dataframe列中，如果是2017，请删除最后4位数字

string、pandas、text、replace、strip

在pandas数据帧中，有一列X，数字如12342017、23456782017、WC456123、ER2017124。如果是'2017‘，我想去掉最后四位。因此，我想要的输出应该是1234,2345677，WC45612，ER2017124

浏览 40提问于2020-03-20得票数 0

回答已采纳

2回答

Django -两个用户访问相同的数据

python、django、multithreading

假设我有一个有两个用户的Django web应用程序。我的web应用程序有一个存在于服务器上的全局变量(从外部SQL数据库的数据创建的Pandas Dataframe )。假设用户向该Dataframe发出update请求，现在Dataframe正在更新。当Dataframe正在更新时，另一个用户对该数据帧发出get请求。有没有办法“锁定”这个Dataframe，直到用户1完成它，然后完成用户2发出的请求？编辑：因此，事件的顺序应该是：用户1发出更新请求，Dataframe被锁定，用户2发出get请求，Dataframe完成更新，Dataframe解锁，用户2收到他/她的请求。如果能

浏览 2提问于2016-11-11得票数 0

3回答

在python pandas dataframe中将列数据从“姓氏，名字”改为“名字姓氏”

python、pandas、dataframe、split、reverse

我有python pandas dataframe，它由用于执行python脚本的power bi数据源转换支持，其中一列由lastname, firstname组成，我需要它由firstname lastname组成。我尝试了以下拆分、反转、连接方法，该方法适用于独立的字符串参数，但当我尝试对pandas数据帧中的列数据使用该方法时，会生成AttributeError: 'Series' object has no attribute 'split'。 name = 'LastName, FirstName' ' '.joi

浏览 62提问于2020-06-17得票数 2

回答已采纳

1回答

删除数据帧中不带索引标题的列

python、pandas

我是Python的新手，我在这个论坛上搜索了一下，没有找到这个问题的答案。我有一个数据帧，第一列没有标题，但由降序数字0，1，2，3，4，...到矩阵的高度(它是一列行号)。我正在尝试删除此专栏，并使用以下代码行： df.drop(df.columns[[0]], axis=1, inplace=True) 这一行从左边删除了我的第二列，而不是我想删除的第一列。如何删除或删除第一列？非常感谢你的帮助。

浏览 3提问于2017-03-17得票数 1

3回答

在pandas python中添加到df中的列

python、python-3.x、pandas

我有一个csv文件，我正在将其转换为pandas数据帧。其中一列a主要用数字填充，偶尔用零填充。我想创建一个新的列e，它是列a+500中的数字，除非该行中有a列的0。在这种情况下，它应该保持0。或者我猜，如果列e为a+500，那么它也可以工作，然后e中所有只是500的情况都变成了零。任何帮助都是很好的，我刚开始使用pandas/python。

浏览 4提问于2016-01-22得票数 2

1回答

如何获取" value“列的平均值，该列根据另一列的值拆分成组

python、pandas

我想以一个简单的数据帧为例，根据另一列("name“列)中的值，将一列(" value”列)求和成组。在那之后，我想得到"value“列的平均值 In [1]: import pandas In [2]: df = pandas.DataFrame(data = [{'name': 'a', 'val': 1}, {'name': 'b', 'val': 2}, {'name': 'b', 'val': 4}]) In [3

浏览 5提问于2021-03-03得票数 0

回答已采纳

2回答

如何在列的数据类型将是字典的情况下创建pandas数据框架？

python、pandas

有没有办法创建一个由两列组成的pandas数据帧？第一列的数据类型是int，第二列的数据类型是字典。然后迭代地将数据插入到数据帧中。

浏览 0提问于2018-07-29得票数 0

2回答

如何忽略列长度检查中的NaN

python、pandas、dataframe

我正在尝试计算数据帧中每一列的最大和最小长度，该数据帧中有一些缺失值。Pandas将这些缺失值视为"NaN“，并将长度计为3。如何在计算最大和最小长度时完全忽略缺失值？下面是我的代码： import pandas as pd columnname=[] maxColumnLenghts = [] minColumnLenghts=[] for colname in df.columns: columnname.append(colname) for col in range(len(df.columns))

浏览 51提问于2020-11-06得票数 1

回答已采纳

1回答

Pandas DataFrame -如何处理可以更改拼写/名称的列名？

python、pandas、dataframe

我正在构建一个进程来摄取一个文件，该文件有时会对同一列使用不同的名称。例如： zipcode, zip, zipcodes, property_zipcode 可以放心地假设，至少zip需要始终出现在名称中。如果没有，脚本可以退出，这是可以接受的。其思想是使用pandas数据帧执行任何数据转换，特别是通过名为zipcode之类的列对数据进行分组。下面是代码示例。df_reported可以是具有地址/邮政编码组合的任何df。但就目前而言，它基本上是一个excel文件，通过read_excel转换为df。 def add_adressid_to_df(df_reported): "&

浏览 14提问于2021-09-09得票数 0

1回答

Pandas:使用set_index()将列设置为索引创建一个子索引。为什么会发生这种情况，以及如何删除它？

python、pandas、dataframe、indexing

我想使用pandas数据帧中的第一列作为行索引，所以我尝试使用来实现，但这样做的副作用是添加了额外的列索引。 (运行选项InteractiveShell.ast_node_interactivity = "all"的jupyter notebook代码)： import pandas as pd df = pd.DataFrame([[l+r*10 for l in range(1, 5)] for r in range(1, 5)]) df # before df.set_index(0, inplace=True) df # after set_index()之前的

浏览 9提问于2018-08-16得票数 3

回答已采纳

1回答

如何在数据帧中定位没有标题的行

python、pandas、dataframe

我注意到，在pandas数据帧中使用.loc时，它不仅找到我正在查找的数据行，还包括我正在搜索的数据帧的标题列名称。因此，当我尝试添加数据的.loc行时，它包含数据+列标题-我不想要任何列标题！ ##1st dataframe df_futures.head(1) date max min 19990101 2000 1900 ##2nd dataframe df_cash.head(1) date$ max$ min$ 1999101 50 40 ##if date is found in dataframe 2, I will collect the

浏览 0提问于2016-12-06得票数 0

2回答

将excel中的一列与excel中的另一列进行比较，然后查找重复的值。

mysql、excel、vba

我只是想知道Excel中是否有一种简单的方法来完成以下任务：在我的Excel电子表格中有两个选项卡。一个选项卡代表一个数据库，另一个选项卡代表一个不同的数据库。在我的第一个数据库(选项卡)中，有一列数据是很长的1500+行，如下所示：在另一个选项卡中，我有另一个类似于上面列的列。我的目标是能够将上述列与单独选项卡中的另一列进行比较，并搜索重复的值。例如，上面列中的第一个代码是00064。它将在单独选项卡中的指定列中搜索代码00064。如果它找到了它，我就需要被警告，或者以某种方式将它记录下来。然后，它将继续到下一个代码，00368，并对列中的每个单元重复这个过程。我希望这是合理

浏览 1提问于2014-10-08得票数 1

回答已采纳

1回答

在对枚举/类别类型列求和时，h2o dataframe GroupBy sum函数的作用是什么？

h2o

想知道当列类型是分类的(特别是h2o enum类型)时，在h2o dataframe GroupBy对象中求和列时会发生什么。将pandas数据帧转换为H2o数据帧。然后，我按某一列对行进行分组，并对其他列求和。 location_id price store ------------------ 1 10 JCP 1 15 SBUX 3 20 HOL then after grouping and summing; df.group_by('location_id').sum(['

浏览 26提问于2019-04-02得票数 0

回答已采纳

3回答

Python Pandas:如何将两个列分组为一个公共列

python、pandas、dataframe

我已经从几个CSV文件创建了一个pandas数据帧。现在有一些列表示相同的内容。在这个数据框中，我想将这些列分组到一个公共列中。 Now: 0 X Y 1 6 2 7 3 1 4 5 我想要： 0 X 1 6 2 7 3 1 4 5 谢谢。

浏览 1提问于2018-11-06得票数 3

1回答

标记为TP，TN，FP，FN的值的混淆矩阵

python-3.x、confusion-matrix

我有一个Pandas数据帧，并想为一列绘制一个混淆矩阵。该列的值是已经标记为“假阴性”、“假阳性”、“真阴性”和“真阳性”的字符串。由于这些不是典型的True/False值，如何使用这些值生成混淆矩阵(类似于scikit-learn/matplotlib生成的矩阵)？ (编辑以澄清)假设我在一列中有以下值： ['True Positive', 'True Negative', 'False Positive', 'False Negative', 'True Negative', ..., True Posi

浏览 14提问于2020-12-22得票数 0

回答已采纳

3回答

如何在pandas dataframe中添加新列的值？

python、pandas、dataframe

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

2回答

多索引列pandas的总和

python、pandas

这是我在pandas中的示例数据帧。它是一个数据透视表。 High School Middle School Year Teachers Students COA Teachers Students COA 2019 40 500 3000 30 200 1000 2018 70 1000 5000 50 400 1500 我想添加三个新的列，名为“教师总

浏览 12提问于2021-08-27得票数 0

回答已采纳

2回答

如果行、列中的值与另一列中的任何位置匹配，则删除Pandas Dataframe中的行

python、pandas

我要做的是删除pandas数据帧中的行，如果该行中的值与另一列中的任何位置匹配。下面是一个用Excel编写的粗略模拟示例： ? 因此，在本例中，我想删除第2行，因为该电子邮件地址位于列C中。非常感谢你的帮助。

浏览 28提问于2019-04-21得票数 0

回答已采纳

1回答

查找至少某个值的第一个值

pandas、pandas-groupby

我在这上面花了几个小时，所以任何帮助都将是令人惊讶的！我有一个熊猫数据帧df。然后我按其中一列(A)分组，关注另一列(B)，并获得每组的平均值： group_mean = df.groupby('A').B.agg('mean') group = df.groupby('A').B 按照上面的顺序，以下是python报告的类型： <class 'pandas.core.series.Series'> <class 'pandas.core.groupby.generic.SeriesGroupBy&#

浏览 2提问于2021-09-04得票数 0

2回答

R-如何对df中的每一列求和

我有这个df df <- read.table(text=" id month gas tickets 1 1 13 14 2 1 12 1 1 2 4 5 3 1 5 7 1 3 0 9 ", header=TRUE) 我喜欢做的是计算每个月的汽油，门票(和我的真实df中的另一个50+行)的总和。通常我会做这样的事情 result <- df %>% group_by(month)

浏览 82提问于2019-05-13得票数 0