在DataFrame切片上设置列值不起作用_Python Pandas警告:试图在DataFrame的切片副本上设置值_如何解决“试图在DataFrame的切片副本上设置一个值”？ - 腾讯云开发者社区

、、

我有一个具有多列的dataframe。我想替换一个名为Discriminant的列中的值。现在，只要在另一个名为ids的列中满足条件，就只需要为几行替换该值。我尝试了各种方法；最常见的方法似乎是使用.loc方法，但由于某种原因，它对我不起作用。以下是我正在尝试的一些不成功的变体：用于条件检查的encodedid变量 indices -用于设置dataframe (从零开始)的变量变异1: df[df.ids == encodedid].loc[df.ids==encodedid, 'Discriminant'].values[indices] = 'Y'

浏览 2提问于2016-10-17得票数 1

回答已采纳

1回答

为蒙面熊猫数据框架添加值

、、、

我试图在dataframe的末尾添加一个新列，但是值根据其他两列中的信息而变化。总的结果应该是一个新列，其中另一列的绝对值已被重新缩放，将绝对值除以列内的最高值。我试图掩盖数据格式，但在for循环的末尾，整个df没有发生任何变化(也就是说，当我请求dr.head()时，没有新列) for n in list(top_dict.keys()): for c in clusters: mask=(data.season==n) & (data.cluster==c) for attribute in panel: ratio

浏览 0提问于2019-06-04得票数 0

回答已采纳

1回答

将最大值应用于pandas数据帧的可变维子集

、

对于具有重复索引的索引列的dataframe，我尝试通过索引获取在不同列中找到的最大值，并将其分配给第三列，以便对于任何给定行，我们可以看到在具有相同索引的任何行中找到的最大值。我是在一个非常大的数据集上这样做的，如果可能的话，我希望它被矢量化。现在，我根本不能让它工作 multiindexDF = pd.DataFrame([[1,2,3,3,4,4,4,4],[5,6,7,10,15,11,25,89]]).transpose() multiindexDF.columns = ['theIndex','theValue'] multiindexDF[

浏览 16提问于2019-02-20得票数 1

回答已采纳

1回答

熊猫索引与复制错误

、

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

1回答

根据包含列名的列，从dataframe列中选择值

、、、

例如，如果我有以下数据 df = pd.DataFrame({'a':[0,1,2], 'b':[3,4,5], 'c':['a','a','b']}) 我希望创建一个结果列，以便输出将是 df1 = pd.DataFrame({'a':[0,1,2], 'b':[3,4,5], 'c':['a','a','b'], 'res':[0, 1, 5]}) 如果'c‘列包含'a

浏览 0提问于2021-07-27得票数 0

回答已采纳

2回答

从具有所有行的dataFrame中选择两组列

、

我有一个包含28列(特性)和600行(实例)的dataFrame。我希望选择所有行，但只选择0-12和16-27中的列。这意味着我不想选择列12-15。我编写了以下代码，但它不起作用，并在: ( 0:12和16: )中抛出语法错误。谁能帮我弄明白原因吗？ X = df.iloc[:,[0:12,16:]] 我知道还有其他选择这些行的方法，但是我很想知道为什么这个行不能工作，以及我应该如何编写它来工作(如果有方法的话)。就目前而言，我写的是： X = df.iloc[:,0:12] X = X + df.iloc[:,16:] 这似乎返回了一个不正确的结果，因为我已经处理了df的df值，但是

浏览 0提问于2021-09-06得票数 1

回答已采纳

3回答

熊猫-在整个dataframe中找到一个具有特定值的列。

、、、、

我有一个DataFrame，它有几个列。有一个列，其值仅在整个dataframe中出现一次。我想要编写一个函数，该函数返回具有该特定值的列的列名。我可以通过通常的数据探索手动找到哪一列，但是由于我有多个具有相同属性的数据，所以我需要能够为多个数据挖掘找到该列。所以一个广义的函数会有更好的用处。问题是，我事先不知道哪一列是我要找的列，因为在每一种数据中，具有特定值的特定列的位置是不同的。另外，在不同的dataframes中所需的列有不同的名称，因此我不能使用df‘’my_ column‘之类的东西来提取列。谢谢

浏览 7提问于2020-12-07得票数 0

回答已采纳

4回答

在熊猫数据中设置一个单元格的值

、

我有以下熊猫资料： K = pd.DataFrame({"A":[1,2,3,4], "B":[5,6,7,8]}) 然后，我将第一行和第一列中的单元格设置为11： K.iloc[0]["A"] = 11 当我再次检查dataframe时，我发现值赋值已经完成，K.iloc等于11。但是，当我在这个数据帧中添加一列并对新列中的单元格执行相同的操作时，值分配是不成功的： K["C"] = 0 K.iloc[0]["C"] = 11 所以，当我再次检查dataframe时，K.iloc的值仍然是零。如果有人能告诉我这里

浏览 0提问于2020-02-14得票数 0

回答已采纳

1回答

如何以其他列为条件向列添加值

、、、

在熊猫中，如何能够在另一列中以字符串为条件的列中添加值？(类似于二维切片手术的东西？) 例如，拥有这样的数据文件： df = pd.DataFrame({'name': ['foo', 'foo', 'bar', 'bar'], 'colx': [1, 2, 3, 4], 'coly': [5, 6, 7, 8]}) 如果列colx是foo，那么如何将10添加到列name？得到的df如下所示： col

浏览 0提问于2017-07-25得票数 1

回答已采纳

1回答

是否有相当于each_slice的Pandas对数据文件进行操作？

、

我想知道是否有一个Python或Pandas函数近似于Ruby方法。在本例中，Ruby方法将接受数组或散列，并将其分解为100组。 var.each_slice(100) do |batch| # do some work on each batch 我试着在Pandas dataframe上做同样的操作。有什么毕达通的方法来完成同样的事情吗？我已经确认了这个答案：然而，它是旧的，不是熊猫的具体。我正在检查，但不知道是否有更直接的方法。

浏览 2提问于2014-08-06得票数 1

回答已采纳

2回答

熊猫:替换列列表中的值列表

、、

我有很多行，很多列数据，它们有不同的“占位符”值，需要替换(在列的子集中)。我在论坛上读过许多使用嵌套列表或字典的例子，但没有发现变体。 # A test dataframe df = pd.DataFrame({'Sample':['alpha','beta','gamma','delta','epsilon'], 'element1':[1,-0.01,-5000,1,-2000], 'elemen

浏览 3提问于2016-07-10得票数 3

回答已采纳

1回答

与pandas系列切片的混淆

、、

我有一个pandas DataFrame，其中一列是出租车行驶的路程。我在本专栏中使用value_counts()，以便查看最常见的行程距离。 b = df['trip_distance'].value_counts() 对象b是pandas系列对象。为了完整起见，本系列的前5行是 1.00 21815 0.90 18915 0.80 18449 1.10 18263 1.20 17823 其中，这意味着最常见的行程距离是1，它出现了21815次，其余的也是如此。但是，如果我键入b[0:4]而不是打印此系列的前4个元素，它会找到与0行

浏览 3提问于2020-10-13得票数 2

回答已采纳

1回答

熊猫转换数据类型取决于您是否得到行，然后是列还是相反。

、

我在潘达斯遇到了这种奇怪的行为，我希望有人能对此有所了解。我有两个列的dataframe，一个是整数类型的，另一个是浮点。然后，我想从第一行，第一列中获取值。要做到这一点，有两种方法，要么通过.iloc[0]先请求第一行，然后获得请求的列['X']，要么先获取列，然后是第一行。前者(行先)将值的数据类型从int更改为float (不想要的行为)，但列首先保留数据类型。这是个窃听器，还是我错过了潘达斯的一些细微差别？下面是再现行为的示例代码 import numpy as np import pandas as pd print(np.__version__, pd.__ver

浏览 2提问于2021-11-29得票数 1

回答已采纳

2回答

为熊猫数据分配重复(或多个)目标元素的新值

、、

我有一只熊猫的数据 df = pd.DataFrame({'AKey':[1, 9999, 1, 1, 9999, 2, 2, 2],\ 'AnotherKey':[1, 1, 1, 1, 2, 2, 2, 2]}) 我希望将一个新值赋给特定的列，并为该列中具有特定值的每个元素分配一个新值。假设我希望将新的值8888分配给具有值9999的元素。我尝试了以下几点： df[df["AKey"]==9999]["AKey"]=8888 但是它返回以下错误： A value is trying to be set on a co

浏览 0提问于2019-02-19得票数 0

回答已采纳

1回答

将函数应用于MultiIndex pandas.DataFrame列

、、、

我有一个MultiIndex DataFrame，其中我想将一个函数应用到它的一个列中，并将结果分配给同一列。 In [1]: import numpy as np import pandas as pd cols = ['One', 'Two', 'Three', 'Four', 'Five'] df = pd.DataFrame(np.array(list('ABCDEFGHIJKLMNO'), dtype='object').reshape(3,

浏览 4提问于2014-04-08得票数 5

回答已采纳

3回答

根据另一列R的条件提取数据格式中的列

、

我想从R中的dataframe中提取一个列，基于同一dataframe中的另一列的条件，数据文件如下所示。 b <- c(1,2,3,4) g <- c("a", "b" ,"b", "c") df <- data.frame(b,g) row.names(df) <- c("aa", "bb", "cc" , "dd") 我希望将列b的所有值提取为数据格式(带有行名)，其中g列的值为'b'，我所需的输出如下： df b

浏览 4提问于2021-08-02得票数 0

回答已采纳

2回答

比较两种数据

、、、、

我有2个数据，其中包含3个帐户指示符，每个帐户号码。帐户号码与“帐户”栏中的类似。我试图修改dataframe 2，以便它与dataframe 1匹配，因为每个列都具有相同的NaN值。 Dataframe 1: import pandas as pd import numpy as np df = pd.DataFrame([[1234567890,1,np.nan,'G'], [7854567890,np.nan,100,np.nan], [7854567899,np.nan,np.nan,np.

浏览 6提问于2022-07-05得票数 0

2回答

值试图在DataFrame的切片副本上设置。

、、、

我有一个dataframe列周期，它的值按季度(Q1、Q2、Q3、Q4)来转换为关联的月份(参见dict)。然而，下面的代码很难理解为什么我会收到这样的警告。值正试图设置在来自DataFrame的片的副本上。尝试使用.locrow_indexer，col_indexer = value代替 quarter = {"Q1":"Mar","Q2":"Jun","Q3":"Sep","Q4":"Dec"} df['period'] = df['pe

浏览 7提问于2016-04-29得票数 11

回答已采纳

2回答

Python: SettingWithCopyWarning:一个值试图在来自DataFrame的一个切片的副本上设置

、、

我的熊猫数据： dframe = pd.DataFrame({"A":list("abcde"), "B":list("aabbc"), "C":[1,2,3,4,5]}, index=[10,11,12,13,14]) A B C 10 a a 1 11 b a 2 12 c b 3 13 d b 4 14 e c 5 我想要的输出： A B C a b c 10 a a 1 1 None N

浏览 7提问于2016-05-25得票数 4

回答已采纳

2回答

熊猫索引-视图-对-复制

、、

我有一个有几列的数据格式。稍后，添加一个名为“Active”的列。如果“音量”列包含大于0的内容，则需要将“Active”设置为1。这是一个简单的例子，说明我是如何尝试的： import pandas as pd active_df = pd.DataFrame(columns=['Volume']) active_df['Volume'] = 0, 0, 22, 22, 0, 22, 0, 22, 0, 22 active_df['Active'] = 0 active_df['Active'].loc[active_df

浏览 0提问于2018-01-18得票数 3

回答已采纳

1回答

如何在python中比较两个不同.csv文件中的列？

、、

import pandas as pd A=pd.read_csv("C:/Users/amulya/Desktop/graves lab/main_now.csv", index_col=False, header=None) DATA1=pd.DataFrame(A) DATA1[0] B=pd.read_csv("C:/Users/amulya/Desktop/graves lab/words.csv", index_col=False, header=None) DATA2=pd.DataFrame(B) DATA2[0] for xrow in ra

浏览 0提问于2018-04-06得票数 1

1回答

具有不同数据类型列的熊猫数据栏切片是否会创建视图或副本？

、、

我有一些数据文件如下： df = pd.DataFrame([[1,2.0],[3,4.0]], index = ['row1','row2'], columns = ['a','b']) df2 = df.iloc[:, :] df3 = df.iloc[:1, :] df4 = df.iloc[:, :1] 列a为int，而列b为浮动。问题：df2, df3, df4视图还是副本？试验1： print(df._is_view, df._is_copy) print(df2._is_view, df2._i

浏览 4提问于2022-11-04得票数 3

回答已采纳

2回答

如何通过AT-POS为不同的类实现2d下标？

下面是一个MRE (展示了两次尝试，为了帮助您进行调试)，以尝试在一个包含系列列的DataFrame上使用across获得2d订阅。 class Series does Positional { has Real @.data = [0.1,0.2,0.3]; method AT-POS( $p ) { @!data[$p] } } class DataFrame does Positional { has Series @.series; #`[ ATTEMPT #1 method AT-POS( $p, $q? ) {

浏览 7提问于2022-02-03得票数 8

回答已采纳

1回答

根据列表条件分配新的DataFrame列

、

我希望根据条件将新列分配给我的DataFrame -如果row.id是bad_cat值之一。 bad_cat = [71,84] df = pd.DataFrame({'name' : ['a','b','c','d','e'], 'id' : [1,2,71,5,84]}) df['type'] = df[df.id in bad_cat] Output: name id type a 1 False b 2 False c

浏览 1提问于2021-02-20得票数 0

1回答

Python循环用于在dataframe的所有列中搜索多个关键字集

、、、

我使用了下面的代码来搜索我的dataframe的所有列，以查看每一行是否都有“池”和“幻灯片”或“水滑”两个词。 AR11AR11_regex = r""" (?=.*(?:slide|waterslide)).*pool """ f = lambda x: x.str.findall(AR_regex, flags= re.VERBOSE|re.IGNORECASE) d['AR'][AR11] = d['AR'].astype(str).apply(f).any(1).astype(int) 这很好，但是当我想

浏览 3提问于2022-09-01得票数 0

回答已采纳

1回答

如何在python中将符号("%")连接到整数值？

、、、、

我在这里面临着一个问题。我有一个Dataframe列，我需要将它的值作为value+%放入，比如10%, 15%等。但是，我可以在写入后将值作为字符串类型放入excel表格中，但是当我绘制图形时，值被视为字符串，因此图表不会生成。我需要在相关的列中粘贴带有%符号的值，以及在写入excel工作表时绘制图形。有什么解决方案吗？？提前谢谢。

浏览 13提问于2017-08-08得票数 2

1回答

熊猫为过滤的数据/系列分配价值。为什么不一致？

、

TL;DR:使用.loc[:, 'foo']而不是.foo 大熊猫什么时候给视图赋值，什么时候给副本赋值？ AFAIK，熊猫要么返回视图，要么复制，这取决于你使用的方法。如果将值赋值给视图，则可以更改原始数据，但如果将值分配给副本，则不能更改原始数据。然而，下面的行为让我感到困惑。为什么将值赋值给视图使用的是dataframe，而不是系列呢？ dd = pd.DataFrame([ {'a': 1, 'b': 2}, {'a': 2, 'b': 4}, {'a': 4,

浏览 5提问于2020-08-27得票数 2

回答已采纳

2回答

如何限制Pandas数据文件中列表的大小？

、、、

假设Pandas Dataframe由一个列(ColumnB)组成，其中的列表具有不同数量的元素()，那么我们如何将列表限制为有第一个2元素呢？ ColumnA ColumnB 0. ['hey', 'hello' ,'great',....] 1 ['USA', 'UK' ,'Germany',....] 2 3 4 ... 预期的输出如下(将ColumnB中的列表限制在最多的2元素上) Co

浏览 3提问于2021-03-03得票数 0

回答已采纳

1回答

根据i-1处的值修改第一行的熊猫数据

、

我工作的熊猫数据时间序列的股票价格。根据股票价格和给定的条件，我创建了一个名为“开放式长系统1信号”('OL_Sys1_Signal')的新列，如果满足该条件，值为1，如果不满足，则为0。我有另一列“关闭长系统1信号”('CL_Sys1_Signal')来告诉我什么时候关闭这个位置。现在，我想创建另一个名为“L_Sys1_Status”的列，只要没有关闭多头位置的信号，该列的值将为1。下面是我想要得到的一个例子：索引(时间序列)，OL_Sys1_Signal，CL_Sys1_Signal，L_Sys1_Status(我想创建的) 00, 0, 0, 0 0

浏览 3提问于2020-06-30得票数 0

回答已采纳

1回答

群函数的系列查询

、、

我有一个名为active的数据框架，它有10个唯一的POS列值。然后对POS值进行分组，并对OPW列进行平均规范化，然后将规范化值存储为独立列['resid']。如果我对POS值进行分组，那么新的活动数据帧的POS列不应该只包含唯一的POS值吗？？例如： df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]}) print df2 df2.groupby(['X']).sum(

浏览 3提问于2015-01-21得票数 1

回答已采纳

1回答

如何通过在python中指定列索引将列表插入到数据框中的特定列中？

、、

我有一个这样的数据帧(my_data)： ID col1 col2 col3 100 nan nan nan 101 nan nan nan 102 nan nan nan 103 nan nan nan 我有一个列表"My_list“，其中有一列和n行： [val1 val2 val3 val4] 我希望将包含1列和n行的列表插入到循环中特定列的dataframe中。我不能使用列的名称，因为在循环中，标题的名称将被更改。输出应如下所示： ID col1 col2 col3 100 nan val1 nan 1

浏览 0提问于2017-09-26得票数 1

1回答

潘达斯中条件降排的不同方式

、、、

我有一个DataFrame，它有一个列(AE)，可以包含: nothing ("")、"X“、"A”或"E“。我想删除值为"X“的所有行。我搜索到了两种方法： df= df.drop(df[df.AE == "X"].index) 或 df=df[df["AE"] != "X"] 但出于某种原因，第一种方法会减少更多的线条。这两行代码做同样的事情吗？在尝试使用第一种方法进行“下降”时，我似乎犯了一个错误。

浏览 6提问于2022-08-08得票数 0

回答已采纳

2回答

将列值更新为数据框行上的循环

、、

我正在尝试获取链接，并通过TinyURL推送它们。我有一个包含登录链接的数据框列，我想单独采取这些，并添加到列‘微网址’，tiny_urlize链接。 for index, row in df.iterrows(): df.loc[index, 'Tiny Url'] = tiny_urlize(row['Login Link']) 我得到的错误如下所示： A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_i

浏览 16提问于2019-02-01得票数 1

1回答

Pandas DataFrame列的布尔掩码

、、、

我的目标是使用布尔掩码从DataFrame获取有用的列。我尝试这样的代码片段： df = pd.DataFrame({'a': [1,2,3,4,5], 'b': [101, 101, 102, 101, 102], 'c': [23, 12, 54, 65, 21]}) mask = [True, False, True] df.columns[mask] 结果就是我真正需要的是： Index([u'a', u'c'], dtype='object') 然后，我尝试使用相同的代码，但使用另一个掩

浏览 1提问于2016-12-26得票数 1

回答已采纳

1回答

在Python上使用cosine_similarity函数

、、、、

import numpy as np import pandas as pd from sklearn.metrics.pairwise import cosine_similarity a = np.array([[3,4],[2,5],[1,2],[1,2],[4,5]]) ap = pd.DataFrame(a, index=['Sonata','Etudes','Waltzes','Nocturnes','Marches'],columns=['search_history','

浏览 12提问于2022-05-02得票数 1

回答已采纳

2回答

如何在Pandas中删除transpose()之后的额外行(或列)

、、、

在数据帧上使用转置之后，总是会有额外的一行作为初始数据帧索引的剩余行，例如： import pandas as pd df = pd.DataFrame({'fruit':['apple','banana'],'number':[3,5]}) df fruit number 0 apple 3 1 banana 5 df.transpose() 0 1 fruit apple banana number 3 5 即使我没有索引： df

浏览 0提问于2016-07-01得票数 17

1回答

基于整数和标签索引混合的多索引熊猫数据分配值

、

我有一个多索引列的dataframe。我希望根据列名在第一个级别上进行选择，然后返回除最后一个列之外的所有列，并为所有这些元素分配一个新值。下面是一个样本数据： In [1]: mydf = pd.DataFrame(np.random.random_integers(low=1,high=5,size=(4,9)), columns = pd.MultiIndex.from_product([['A', 'B', 'C'], ['a', 'b', 'c']

浏览 3提问于2015-06-08得票数 0

2回答

是否有任何方法可以通过在该行的值中指定一个特定列来访问数据帧的任何一行？

、

我必须访问“a”栏中第五大值的索引。我对列'a‘进行了排序，但是在这样做时，索引列也被排序了，所以我又创建了一个名为' index’的列，并在该列中添加了0-9的值。现在，我想访问索引no。“索引”列值为4的行中，有谁能帮我做到这一点吗？我也想要一个更有效的方法来解决这个问题。 df = pd.DataFrame(np.random.randint(1, 30, 30).reshape(10,-1), columns=list('abc')) df.sort_values('a',inplace=True) df['Index']

浏览 4提问于2020-05-08得票数 0

回答已采纳

1回答

如何修改熊猫数据框中一个“单元格”中的值？

、、、

我有一个非常简单的问题。我想更改pandas数据框中给定行的给定列中的值。我试着用下面的方法来做： df['column3'].loc[this_date] = val 因此，我得到以下警告： SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame 我对此警告的解释是，通过使用列名('column3')和loc，我并没有真正访问(引用)数据框中所需的单元格。相反，我创建了一个对象，它是"cell“对象的副本，然后我尝试更改与这个&#

浏览 0提问于2014-10-30得票数 4

1回答

从特定行开始，从2列获取所有记录

、、、

设置通过扩展，我可以访问包含数据的谷歌表。通常，我使用df = pd.DataFrame(wsheet.get_all_records())将所有数据转储到熊猫数据中。问题我只需要5个特定的顺序列的数据，即所有列包括和介于Google表的第1和第5列之间。此外，我只需要从谷歌表格第5行开始的数据。我已经尝试了我的常规df = pd.DataFrame(wsheet.get_all_records())，然后在熊猫栏和行。然而，我认为由于我在Google表前4行中使用的标记，由此产生的dataframe有一些奇怪之处--在熊猫中进行调整会产生奇怪的结果。问题考虑到标记，我怀疑

浏览 5提问于2020-04-02得票数 2

回答已采纳

1回答

选择和切片作为PeriodIndex的列

、

我有一个DataFrame，其中每个月的列都是PeriodIndex，如下所示： df = pd.DataFrame(np.random.randn(3,4), index = np.arange(3), columns = pd.period_range('2015-01', freq = 'M', periods = 4)) 2015-01 2015-02 2015-03 2015-04 0 -1.459943 -1.572013 2.977714 -0.067696 1 -1.545259 -

浏览 4提问于2016-03-18得票数 7

回答已采纳

2回答

选择值小于x值的dataframe中的列，并排除对某些行的此操作。

、、、

我有一个数据框架 In = pd.DataFrame([ #["A", "B", "C", "D","E","F"] ["V", 13, 0.0, 45, 65, 32], ["W", 23, 45, 0.06, 78, 33], ["X", 12, 37, 53, 0.00, 0.9], ["Y", 12, 34, 56, 0.03, 36], ["

浏览 5提问于2022-01-24得票数 1

回答已采纳

1回答

如何从csv文件中选择三列系数数据

、、、、

我想根据数据集中的行索引，最好通过Pandas.DataFrame来绘制2种不同场景的列数：第一种场景：列index2,5,8，.，n+2 第二个场景：最后480个列或列索引961-1439 我尝试使用列索引，如下所示： import pandas as pd import numpy as np import matplotlib.pyplot as plt dft = pd.read_csv("D:\Test.csv" , header=None) dft.head() id_set = dft[dft.index % 2 == 0].astype('in

浏览 0提问于2019-04-04得票数 0

回答已采纳

2回答

从数据帧中选择特定值

、

我试图从dataframe中选择一个值。但是问题是输出是带有数据类型和列名的。这是我从csv文件中读取的数据框架， Name,Code blackberry,1 wineberry,2 rasberry,1 blueberry,1 mulberry,2 这是我的测试代码- dataFrame=pd.read_csv("test.csv") value = dataFrame.loc[dataFrame['Name'] == 'rasberry']['Code'] print(value) strvalue=str(value) i

浏览 5提问于2017-01-29得票数 6

回答已采纳

2回答

在新的dataframe中将重复值作为列的名称，行作为另一列中的对应值。

、、、

为了解释我的意思，让我们使用以下示例： ------------------------ |A | B | C | ------------------------ |JAVA | 2 | 1 | ------------------------ |JAVA | 40 | 22 | ------------------------ |JAVA | 40 | 52 | ------------------------ |JAVA | 22 | 7 | ------------------------ |PYT

浏览 1提问于2021-01-24得票数 0

回答已采纳

1回答

熊猫: DataFrame.sum()或DataFrame().as_matrix.sum()

、

我正在编写一个函数，用于计算有800列的pd.DataFrame中的所有列的条件概率。我编写了几个函数的版本，发现两个主要选项在计算时间上有很大的差异： col_sums = data.sum() #Simple Column Sum over 800 x 800 DataFrame 选项#1: {'col_sums‘和'data’分别是一个系列和DataFrame } 这包含在index1和index2上的一个循环中，以获得所有组合 joint_occurance = data[index1] * data[index2] sum_joint_occurance = jo

浏览 0提问于2013-02-13得票数 3

回答已采纳

1回答

熊猫数据“全真实”标准

、

Python 2.7，Pandas 0.18。我有一个DataFrame，还有一些方法可以通过一个条件参数来选择行的子集。我想知道一种更惯用的方法来编写与所有行匹配的条件。下面是一个非常简单的例子： import pandas as pd def apply_to_matching(df,criterion): df.loc[criterion,'A'] = df[criterion]['A']*df[criterion]['B'] df = pd.DataFrame({'A':[1,2,3,4],'B

浏览 3提问于2016-10-27得票数 1

回答已采纳

2回答

从某些列值中移除字符串，然后操作它们

、

我有一个名为月份(如下面)的列的dataframe，但是它包含一些作为"x年“传递的值。因此，我想删除“年”一词，并将它们乘以12，这样所有列都是一致的。 index months 1 5 2 7 3 3 years 3 9 4 10 years 我试过 if df['months'].str.contains("years")==True: df['df'].str.rstrip('years').astype(float) * 12

浏览 1提问于2021-03-30得票数 1

回答已采纳

1回答

如何在不获取SettingWithCopyWarning的情况下有效地更新dataframe的列？

、、

我有一个包含多个列的dataframe，我只想用新值df['Z'] = df['A'] % df['C']/2更新一个列。但是，即使我使用.loc[]方法，或者当我使用drop()列并再次添加它时，我仍然会收到loc[]消息。 :75: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead 虽然警告用.ass

浏览 4提问于2020-08-14得票数 2

2回答