替换pandas中依赖于其他列和条件的列值_替换pandas中条件为其他两列的一列的值_在pandas中如何改变列的值依赖于其他列？ - 腾讯云开发者社区

、、

? 在上面的数据框中，我试图使用pandas将最后一列中的NaN和负值替换为0，我在这里使用了一些建议，但这似乎也会影响其他列，并将其他列中的值替换为零。如何将其限制为只显示选定的列

浏览 211提问于2021-08-25得票数 0

1回答

为什么pandas.where()返回'None‘

、

我试图使用pandas.where()从数据帧中的列中删除负值。删除负值的最明显方法是在列上运行pandas.abs()。所以： import pandas as pd frame = pd.DataFrame([-1,-1,-3,-4,-5],columns=["amount"]) frame.amount = frame.amount.abs() 但是我想使用pandas.where()来尝试同样的方法。因此，我尝试了以下几点： frame.amount = frame["amount"].where(frame["amount"] &

浏览 0提问于2019-05-27得票数 2

回答已采纳

1回答

将值映射到特定行和列- Python

、、、

我有一个数据集，我想在其中匹配索引行并更改该行中的列的值。我已经查看了map和loc，并且能够使用df.loc定位数据，但是它过滤掉了这些数据，当找到该行时，我想要做的就是更改该行列中的值。最好的方法是什么--我最初的帖子可以在这里找到：在excel中做这件事很简单，但与Pandas做斗争是很容易的。编辑：到目前为止，我有这样的工作，但它包括了大量的数字后，总计算与dtype: int64。 import pandas as pd df = pd.read_csv(r'C:\Users\david\Documents\test.csv') multiply =

浏览 2提问于2022-01-22得票数 0

2回答

如何在数据框某些行的所有列上使用pandas apply函数

、、

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

2回答

数据帧列值计算和替换

、、、、

我需要您的帮助来计算DF列的新值，然后用计算出的值替换旧值。我是新人，在粘贴代码时遇到了问题(很抱歉)：在36年内 import pandas as pd import numpy as np import math import random df = pd.DataFrame({'beerstyle': ['light', 'dark','light', 'dark'], 'beername': ['coors', 'guiness','bud'

浏览 2提问于2015-09-11得票数 1

2回答

Pandas根据布尔数组就地修改列值

、

我知道如何使用apply或np.where基于另一列的值创建新列，但是我想不起一种选择性地更改现有列的值的方法；我怀疑其中是否涉及df.ix？我说得对吗？例如，下面是一个简单的dataframe (我的数据帧有数万行)。如果名称以字母‘e’结尾，我想更改'flag‘列中的值(假设为'Blue')： >>> import pandas as pd >>> df = pd.DataFrame({'name':['Mick', 'John', 'Christine',

浏览 0提问于2014-05-01得票数 9

回答已采纳

1回答

如何使用for循环在dataframe中插入新列，并根据某些条件将值传递给它。

、

我需要在现有的数据框架中创建另一个列。对于这个新列，我需要使用for循环传递一些值，这些值是字符串类型的。我无法获得所需的输出。我首先创建了一个序列，并尝试通过for循环将一些字符串值传递给这个序列。在此之后，序列被传递到pandas插入函数中，以便在数据框中附加序列并传递值。在这里，我想创建一个名为Type_new的列，它的类别为Low named和High create。 data2是一个现有的数据框，我将在同一数据框中创建一个名为Type_new的新列使用的代码如下所示，并带有错误消息。请分享你的观点，帮助我解决这个问题。 Type_new = pd.Series([]) fo

浏览 0提问于2019-09-03得票数 0

2回答

FutureWarning:元素比较失败；当从熊猫数据中删除所有行时

、、

我想将那些行放在列“候选人”中值为“0”的dataframe中。在本专栏中，我的一些数据文件只有'0‘值。我希望在这种情况下我会得到一个空的dataframe，但是我会得到以下警告和不变的dataframe。在这种情况下，我怎样才能得到一个空的数据？还是防止返回未更改的数据？警告信息： C:\Users\User\Anaconda3\lib\site-packages\pandas\core\ops\array_ops.py:253: FutureWarning:元素比较失败；返回标量，但将来将执行元素比较res_values =方法(Rvalue) 我的代码： with open(

浏览 4提问于2020-06-12得票数 1

1回答

为什么会出现“值的长度与索引的长度不匹配”的错误？

、

我有以下代码，我正在尝试将True分配给一个新列，其中实际日期等于列'D‘(创建日期)中的日期，并将False分配给任何其他列。我是Python的新手，所以我想知道我做错了什么： def GetData(): myList = GetFileList(TodaysDate,5) NewDataFrame = pd.DataFrame() for x in myList: #The date of the actuals data is the day BEFORE it was created ActualDate = g

浏览 0提问于2016-02-24得票数 2

回答已采纳

5回答

根据pandas中的另一个值更改一个值

、

我正在尝试用Python重现我的Stata代码，我被指向Pandas的方向。然而，我很难理解如何处理这些数据。假设我想迭代列标题‘in’中的所有值。如果该ID与特定数字匹配，那么我希望更改两个相应的值FirstName和LastName。在Stata中，它看起来像这样： replace FirstName = "Matt" if ID==103 replace LastName = "Jones" if ID==103 因此，这将替换与ID == 103到Matt的值相对应的FirstName中的所有值。在Pandas中，我正在尝试这样的东西 df =

浏览 97提问于2013-10-07得票数 152

回答已采纳

2回答

不同栏大熊猫不同条件下的过滤

、、

Python 3.9和Pandas 1.3.4 这里是df： 1 First Name Last Name fullname 2 Freddie Mercury Freddie Mercury 3 John Lennon John Lennon 4 David Bowie David Bowie 5 John Doe 6 Joseph Joseph 7 Jovi Jovi 我的代码目前只发现f

浏览 7提问于2021-11-23得票数 1

回答已采纳

1回答

用基于条件的值替换熊猫数据框中列中的值。

、、、、

我有一个很大的，并且希望根据条件在列的子集中替换一些值。具体来说，我希望将大于1的值替换为第9列右边的每一列中的1。由于dataframe太大，而且随着时间的推移，行数和列数都在增加，所以我不能手动指定要更改值的列的名称。相反，我只需要指定应该检查第10列和更高部分的值> 1。在查看了许多不同的Stack溢出帖子和Pandas文档之后，我尝试了： df.iloc[df[:,10: ] > 1] = 1 然而，这给出了一个错误：“不可接受的类型：‘片’”。然后我试着： df[df.iloc[:, 10:] > 1] = 1 和 df[df.loc[:, df.colum

浏览 2提问于2021-04-20得票数 1

回答已采纳

1回答

使用Pandas "where“函数时出现类型错误

、、

我有一个数据集，其中有一列名为"YearMade“，类型为int64。我正在尝试替换"YearMade“列中的值，其中任何小于1918的值都将替换为该列的中位数。所以我试着： df.where(df['YearMade'] > 1918, df['YearMade'].median(), inplace = True) 但是，我得到了一个类型错误。我在这里做的是什么错了？那么，如何纠正它呢？请参阅下面的错误消息： <ipython-input-83-b202aa389b1d> in <module> 1

浏览 2提问于2019-11-06得票数 0

回答已采纳

3回答

将组分配值

、、

我有一个包含多个列(20)和行(16404)的pandas数据帧。其中一列是“age”。我希望能够绘制其他指标，例如在某个年龄类别上的“收入”。20岁以下的男性和20岁到40岁的女性的收入是多少？我尝试过这种情况： for i in range(len(df['age'])): if df['age'][i]<25 and df['Gender'][i]==1: df['group'][i]=1 但是我得到了以下错误：The truth value of a Series is ambiguous.

浏览 0提问于2018-08-08得票数 0

1回答

Python .loc混淆

、、、

我正在使用Datacamp平台为泰坦尼克号做一个Kaggle教程。我了解.loc在Pandas中的用法--使用列标签逐行选择值…… 我的困惑来自于这样一个事实:在Datacamp教程中，我们希望定位"Sex“列中的所有"Male”输入，并将其替换为0。他们使用以下代码段来完成此操作： titanic.loc[titanic["Sex"] == "male", "Sex"] = 0 有人能解释一下这是怎么回事吗？我以为.loc接受行和列的输入，那么==是用来做什么的？它不应该是： titanic.loc["male

浏览 20提问于2017-07-11得票数 5

回答已采纳

1回答

按日期列出的未索引数据的pandas中的累加和

、、、

我遇到了这样一种情况:我正在尝试根据几个标准对大型数据集中的值进行求和。我已经设法通过使用带有另一个脚本的嵌套循环实现了这一点，但我希望使用Pandas可能会更容易。我的数据集是这样的。 date regionNo sales 2020-04-15 1 2 2020-04-14 1 3 2020-04-15 2 3 2020-04-14 2 1 我想要添加一个列，用于指示某个地区在该特定日期的累计销售额。条件语句应该类似于： salesSum = sum(['sa

浏览 8提问于2020-05-26得票数 0

2回答

Python Pandas:替换字符串类型列中的浮点值？

、、

Pandas有isnull()和NaN ()方法来替换DataFrames中的填充值。我有一个数据集，其中大部分是字符串类型的列，但一些列中散布着一些浮点值。在Pandas中有没有一些等价的方法来查找和替换它们？因此，如果我有一个这样的DataFrame： In [60]: df1=pd.DataFrame([[1.0,'foo'],[2.0,1.0],[float('NaN'),'bar'],[4.0,0.0],[5.0,'baz']],columns=['fval','sval']) In

浏览 13提问于2020-03-29得票数 0

1回答

Python:如何获得大于n个字符的二维数组的字符串值？

、

s = (["id" "title" "name"] ["1" "show" "anna"] ["2" "hide" "joh"] ) 我需要得到长度超过2个字符的字符串值。预期产出： s = (["id" "title" "name"] [ "" "show" "anna"] [ ""

浏览 1提问于2022-06-19得票数 0

回答已采纳

1回答

如何删除具有多个条件的pandas中的列

、、

我刚接触python和pandas 在下面的数据框中，我需要删除完全为" None“的列，其中包含"blanks None"，但不删除包含值和None的列 ? 在上表中，我希望删除列A和列C，因为它们完全是“无”或“空白和无”，但是列B至少在3个单元格中有一些有效数据，它不应该被干扰如何在df.drop (pandas)中给出这个条件

浏览 48提问于2021-11-11得票数 0

回答已采纳

2回答

熊猫的功能与我所期望的相反

、

我试图在Pandas DataFrame列中将NaN转换为0，而"where“函数的行为与我所期望的相反。下面的代码将创建一个数据框架，其中包含一个列，其中NaN位于索引4、5、6和7。 from collections import Counter import pandas as pd x = Counter(pd.np.random.choice(24,2000)) df = pd.DataFrame({'x':x}) df.loc[4:7,'x'] = pd.np.nan df 我用过 df.where(df.isnull() == True

浏览 2提问于2017-07-20得票数 3

回答已采纳

1回答

如何解决使用Google反向地理编码API遍历pandas数据帧的问题？

、、、、

我正在尝试使用Google的反向地理编码API来获取250个纬度和经度坐标列表中的城市、州和国家。pandas数据帧df包含列df‘’point‘中的位置坐标。我想将城市、州和国家作为新列添加到原始df中。下面的python代码对于州和国家列非常有效，但是对于城市列却失败了，因为'city_list‘少了两个结果。我得到了这个错误： ValueError: Length of values (248) does not match length of index (250) 我一直在努力想办法解决这个问题。对于不能生成城市的两行，有没有办法在列表中添加"error“？非常非常

浏览 18提问于2021-06-13得票数 0

2回答

Python/Pandas替换列函数中的值

、

**使用Pandas 1.4.2，Python 3.9.12 我有一个数据集，其中列值表示为0或1，分别代表“否”和“是”。 Scholarship Hipertension Diabetes Alcoholism SMS_received 0 0 1 0 0 0 1 0 0 0 0 0 2 0 0

浏览 9提问于2022-07-07得票数 1

2回答

根据条件删除dataframe中的行，dataframe vs list boolean？

、

import pandas as pd data = [['a',1],['b',2],['c',3]] df = pd.DataFrame(data, columns = ['letter', 'number'] exclude_list = [2, 4, 6] 我想将df中的第2行(其中“==”为2)更改为空/nan。我希望通过将"number“列与排除列表进行比较来实现此目的，如果存在匹配，则排除该行。

浏览 0提问于2020-08-24得票数 2

2回答

为什么dropna在本专栏中似乎不起作用？

、、

我尝试删除一个列Filmname中的所有NA值，但是这些值没有被删除。为什么？(我的结果截图) 下面是我的代码： import pandas as pd df = read.csv.... df.dropna(subset=['Filmname'], inplace=True) df.head()

浏览 9提问于2018-06-15得票数 1

1回答

值的Dask长度与索引长度不匹配错误

、、

我遇到了一个非常奇怪的错误，它涉及到将新列分配给现有的dask dataframe。给出下面的最小示例， import pandas as pd from dask import dataframe as dd from dask import array as da foo = dd.from_pandas(pd.DataFrame({'number':list(range(10))}), chunksize=2) add_me = ["N/A" for _ in range(len(foo.index))] add_me = da.from_array(a

浏览 0提问于2020-02-19得票数 4

1回答

熊猫DataFrame -用旧日期替换Datetime列的空值

、

问题：如何将Pandas DataFrame中的datetime列的NULL值替换为类似于1900-01-01 00:00:00.000的内容我使用Pandas数据帧将大型数据文件导入到SQL Server 2019表中。下面的代码正确地将数值列的空值替换为0，将对象(字符串)列的空值替换为空字符串。但是它不会将datetime列的空值更改为1900-01-01 00:00:00.000。 import sqlalchemy as sq import datetime import pandas as pd import numpy as np ............ .........

浏览 5提问于2022-04-15得票数 0

1回答

如何将dataframe中的句点值替换为null或其他值？

、、、

以下代码： print(PB_PID_group) print(type(PB_PID_group)) 给了我： PI . [., 5398, 5482, 5467] 1311 [5185, ., 5398, 5467, 5576] 1667 [., 6446] 3352 [.] 935 [.] Name: PID, dtype: object <class 'pandas.core.series.S

浏览 0提问于2016-12-26得票数 1

回答已采纳

3回答

如何在Python中创建简单标志

、、、

在从雅虎获得间谍数据后，我创建了一个收盘价渠道，如下面所示，使用Max和Min滚动窗口。列为HC和HL。我需要创建一个列(我称之为标志)，当收盘价等于HC时显示1，并且这个值一直持续到close将等于HL。此时，国旗的价值将是-1。正如你所看到的，它非常简单，国旗只能有两个值:1或-1。简单的公式如下：如果关闭== HC，则标志为1。如果关闭== HL，则标志为-1。如果Close != HC和Close !=HL，则标志等于保存在变量标志上的最后一个值。我尝试过几种方法，包括下面的代码，但都没有成功。此代码的问题是显示了0值。我不知道如何让它有条件地消失： i

浏览 3提问于2019-07-25得票数 5

回答已采纳

1回答

如何在条件为真时对pandas列的值求和(Python)

、、

我有一个Pandas Dataframe，它有一个名为A的列和不同的值： [A] 1 1 4 5 6 7 5 4 1 1 1 我想创建另一个列-called B，并在A>2时将A的值相加。如果此条件不为真，则结果应为0。最后，我的示例的结果应该是： [B] 0 0 4 9 15 22 27 31 0 0 0 在Excel中执行此操作非常简单，因为您可以将A的值与前一个B值相加。但是我不知道用Python怎么做。我试过了： DF['B'] = np.where(DF['A'] > 2, DF['A'] + DF['B'

浏览 17提问于2020-04-08得票数 0

回答已采纳

3回答

根据另一个系列中的值替换一个系列中的值的简单方法？

、

在下面的代码中，如果列NaN中的对应值为1，则将b列中的所有a值替换为空字符串。代码可以工作，但我必须输入两次df.loc[df.a == 1, 'b']。有没有更短/更好的方法来做呢？ import pandas as pd df = pd.DataFrame({ 'a': [1, None, 3], 'b': [None, 5, 6], }) filtered = df.loc[df.a == 1, 'b'] filtered.fillna(

浏览 0提问于2019-05-29得票数 1

回答已采纳

2回答

根据两个相关条件删除数据行

、

我有一个相当大的dataframe (几百列)，我想对它执行以下操作。下面我使用了一个简单的条件来说明我需要什么。对于每一行:条件#1:检查两个列的值为零(0)。如果这是真的，请保留该行，然后转到下一行。如果任一列的值为零(0)，则条件为True。如果条件#1为False (第1列或第4列中没有零)，则检查行中的所有其余列。如果其余任何列的值为零，则删除该行。我希望将过滤后的数据作为一个新的、单独的数据返回。到目前为止我的代码是： # https://codereview.stackexchange.com/questions/185389/dropping-rows-from-a-p

浏览 1提问于2019-11-10得票数 1

回答已采纳

3回答

从数据帧python中的特定位置删除缺少值的行

、、

很好的人，我仍然在学习python.Now --我有大约100万行的巨大数据，但是我要做的是从某些列位置删除缺少值的行。我的意思是，在定位了某些列中缺少值的行之后，我应该能够在示例dataframe中删除整个row.Look： import pandas as pd data = {'A':['NW', 'NB', 'UK', 'CAN'],'B':['Tom', 'nick', 'krish', 'jack'], 'C&#

浏览 4提问于2019-10-14得票数 2

回答已采纳

1回答

当列介于两个值之间时，汇总Pandas数据

、

在python中，我有一个Pandas dataframe (df)，可以在下面进行复制。 import pandas as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021-08-13', 'item2', 'CA', 8], ['2021-06-12', 'item3', 'NY'

浏览 1提问于2021-09-21得票数 1

回答已采纳

3回答

如何用NaN替换离群值，同时使用python中的pandas保持行的完整性？

、、、

我正在处理一个非常大的文件，需要为每一列消除不同的异常值。我已经能够找到异常值并用NaN替换它们，但是它将整个行都变成了NaN。我确信我错过了一些简单的东西，但我似乎找不到它。 import pandas as pd import numpy as np pd.set_option('display.max_rows', 100000) pd.set_option('display.max_columns', 10) pd.set_option('display.width', 1000) df = pd.read_excel('

浏览 3提问于2019-04-23得票数 0

1回答

基于大熊猫第三栏的两栏选择

、、、

我有一个Pandas数据集，包含三列，例如A、B、C。我想将D列添加到基于C中的值从A和B中取来的数据中，例如，如果C< 0.5，则D应该包含来自B的值，否则来自A的值如何实现？

浏览 1提问于2021-08-05得票数 1

回答已采纳

1回答

如何对Pandas dataframe中的列应用格式

、

我有一个包含90列的pandas数据框，我想对每一列应用一种格式。每一列都有自己的格式，并且具有该格式的函数具有与该列的名称相同的名称。我想将格式应用于数据框上的每一列。例如，假设dv，dw是我的数据帧df的两列： dv 1 2 1 1 5 5 dw 2 2 1 3 2 3 def dv(dv): if dv==1: return 1 else: return 0 def dw(dw): if dw==2: return 1 else: return 0 我正在使用下面的命令： df

浏览 10提问于2020-10-11得票数 0

1回答

Pandas水平填充NA值，但仅限于一个正向填充值

、

我想水平地向前填充值，但仅限于一个填充值。请看下面的框架：dfa有一些空白需要填补。我想要dfb中显示的结果。 (请注意行尾的.T，即水平转置数据。) 但是，dfa.fillna(0, limit=1, axis=1)填充Name行中的所有单元格，而第5列和第6列(即Name行中7左侧的两列)应保持为NaN。 import pandas as pd import numpy as np dfa = pd.DataFrame({'Name':[1, np.nan, 3, np.nan, np.nan, np.nan, 7, np.nan],

浏览 15提问于2019-09-27得票数 2

回答已采纳

2回答

熊猫数据栏值不区分大小写替换其中的<condition>

、、、、

是否有不区分大小写的pandas.DataFrame.replace？版本？我需要替换列中的字符串值，该列受表单“其中标签== a或标签== b或标签== c”的不区分大小写的条件影响。

浏览 3提问于2017-12-07得票数 7

回答已采纳

1回答

熊猫合并:如何返回您已完成合并的列？

、

我有一个数据和一些明确的数据。我想要创建一个新的列，它只显示其中一些值，并将其他值转换为“other”。例如，只显示前十名城市，或者，在下面的示例中，只显示两种颜色，并将其他颜色转换为“其他”。我想要通过一个pandas.merge来完成它，就像一个SQL外层连接:一方面是我的表，另一方面是一个表，它只包含我想保留的值(即不转换为“other”)。问题是，我花了一些调试和脏话才发现，pandas.merge并不返回您已经完成合并的两个列，即使其中一个列有空。我找到的解决方案是创建另一列，其值与相同--我认为这会使任何熟悉的人都熟悉。有更优雅的方式吗？这就是我要表达的意思： import

浏览 0提问于2019-03-20得票数 2

回答已采纳

2回答

根据条件创建新的Pandas列，但这些值不会生成

、、

我正在尝试完成一个简单的任务:根据其他列的条件在Pandas dataframe中创建一个新列。我曾咨询过其他帖子(例如，，但也有其他采用不同方法的帖子)，但都没有成功。我现在遇到的问题是，在新列中只返回函数中定义的最后一个值。例如：我有以下一栏： x 1 2 3 我想添加一个新的标签栏： x size 1 Small 2 Medium 3 Large 下面是最新的尝试代码： import pandas as pd import numpy as np df = pd.read_csv('blah.csv') def size (row

浏览 1提问于2019-03-04得票数 3

回答已采纳

1回答

Excel:用vlookup和其他单元格中的值进行条件格式化

、、、

我希望根据另一个单元格中的值来改变单元格中的颜色。复杂的是，我需要首先匹配两个单元格中的值，然后选择它旁边的值，然后根据这个值应用条件格式。参考下面的图像: Ex1:在A列中查找E2，然后在C列中选择相关的值。使用C列中的值确定条件格式(即用绿色、红色、琥珀或灰色填充E2，分别表示是、否、不知道或不相关)。 Ex1:在A列中查找G3，然后在C列中选择相关的值。使用C列中的值确定条件格式(即用绿色、红色、琥珀或灰色填充G3，分别表示是、否、不知道或不相关)。如您所见，我能够应用基于单个单元格值-4规则的条件格式。但是，必须为100个单元格中的每个单元格创建4条格式规则是很乏味的。

浏览 1提问于2022-03-16得票数 0

4回答

查找df列是否以值开头，并根据该值剥离或设置为none

、、

我是pandas的新手，我想知道我们是否可以编写一行代码来检查和转换使用lambda的列。 pandas列包含PL和TM之间的值。其思想是创建函数转换器，以便在“PL123”或“TM123”设置为“missing”时从列中剥离PL。提前感谢您的帮助！

浏览 23提问于2021-07-06得票数 0

1回答

Pandas中插值函数的不确定性

、、、

我正在使用pandas中的插值函数。下面是一个玩具示例，用于说明情况： df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) df.iloc[1, 0] = np.nan print df print df.interpolate('nearest') 我的问题是：interpolate函数是否适用于多列？也就是说，它是否使用多元分析来确定缺失字段的值？或者它只是简单地查看单个列？

浏览 10提问于2016-03-30得票数 2

1回答

检查数据框列中的列表成员并追加结果吗？

、

使用Pandas DataFrame、df和函数，如下所示 def code(x): for item in x: if x in [21,32]: return'Cat A' elif x in [22,34]: return"Cat B" else: print ('sorry') 我有一个DataFrame df，它有一个包含数字的列('Ref') df = **Document No**

浏览 3提问于2020-06-20得票数 0

回答已采纳

1回答

如果值在特定的值范围内，则用NaN填充值。

、、、、

我正在处理一个要求，如果特定值在no的特定范围内，我必须以NaN的形式填充它们。 import pandas as pd data = {'A': [1, 2,3,4,5], 'B': [3, 4,5,6,7]} k=pd.DataFrame(data) 如果no大于5，则将列中的这些特定值填充为NaN。所以col B就像'B':[3,4,5,NaN,NaN] 我该怎么做？

浏览 1提问于2022-02-05得票数 0

回答已采纳

3回答

查找所有日期的公共ids python

、、

我在一个数据帧中有两列。ID和日期。我想要查找所有给定日期的通用I。有很多方法/解决方案来解决这个问题。我想知道python、pandas或numpy中是否有内置函数可以帮我完成这项工作。让我通过示例向您展示： Date Id 2019-04-01 334 2019-04-01 335 2019-04-01 336 2019-04-02 334 2019-04-02 335 在这种情况下，答案是： Date Id 2019-04-01 334 2019-04-01 335 2019-04-02 334 2019-04-02

浏览 13提问于2019-04-24得票数 1

回答已采纳

3回答

从pandas.dataframe中删除低频值

、

如何从pandas.DataFrame中的列中删除很少发生的值，即低频值？示例： In [4]: df[col_1].value_counts() Out[4]: 0 189096 1 110500 2 77218 3 61372 ... 2065 1 2067 1 1569 1 dtype: int64 因此，我的问题是:如何删除2065, 2067,

浏览 5提问于2015-09-10得票数 30

回答已采纳

2回答

在pandas数据帧中，我希望通过将其他列过滤为特定值来为列赋值

、

例如，我想要将'ModelPrediction‘列中的所有值更改为1，其中'AgeGrp’列等于0，5，'Sex‘列等于male，'PClass’列等于'1‘和'2’。我已经将AgeGrp、Pclass列的数据类型更改为object。 ? 我的尝试如下： train.loc[train['Sex'] == 'male' & ['Pclass'] == 1 & ['Pclass'] == 2 & ['AgeGrp'] == (0, 5

浏览 14提问于2019-02-24得票数 1

回答已采纳

1回答

Excel条件格式-组合

、、

我有一份电子表格名册。每行代表今年秋季每月举行一次会议的组织中的不同个人(总共4次会议)。我们使用Excel来跟踪会议，因此有4列：“9月”、“10月”、“11月”和“12月”。每当那个人参加一个会议，我们就把x放在适当的月份。我们也有其他列，我熟悉在其他列中使用条件格式。该组织的要求是，在秋季的4次会议中，个人必须至少参加3次，但他们选择参加的月份并不重要。如果该行在4个会议列上有3个x的组合(代表参加了3次会议，无论是哪一个月)，我如何使整个行突出显示绿色？我知道如何用简单的任务进行条件格式化，但我很困惑.如何对至少4个框中的3个进行编码，使其具有一个x，而不管3个x的列来自哪一个组

浏览 5提问于2017-12-20得票数 1

回答已采纳

1回答

默认情况下对Pandas数据帧使用.loc

、、

我知道访问Pandas中的索引/列的常用方法(还请参阅索引)：整数定位的df.iloc[..., ...] 基于标签的位置的df.loc[..., ...] df.ix (不推荐) 用于列访问的df['C1']或df.C1 df['mylabel1':'mylabel10']或df[2:7]用于行片访问，但df['mylabel1']和df[2]显然不起作用我一直觉得最后两个要点令人困惑，因为对于列访问或行访问，我们都使用相同的符号df[...]。 DataFrame**)问题:是否有一种配置Pan

浏览 4提问于2022-06-24得票数 2