使用str Index获取数据帧的行值的函数_“str.contains”不返回数据帧中的值_使用iloc[x，y].str对特定的数据帧值调用contains() - 腾讯云开发者社区

python、pandas

您好，我有一个pd数据帧列表(共1377个)。我需要将每个数据帧分成行索引以a结尾和行索引以c结尾的两种情况。我已经查看了其他堆栈溢出页面，其中建议这样做。 (df.iloc[all_dfs[0].index.str.endswith('a',na=False)]) 然而，这会转置我的数据帧，然后减少行数(在转置之前是列) 这是我的第一个dataframe中的一小部分，如果有帮助的话。 ?

浏览 18提问于2020-01-12得票数 2

回答已采纳

1回答

根据熊猫Python中另一个数据的条件从一个数据中删除行

python、python-3.x、pandas、dataframe、modin

我有两个熊猫数据框架，包含数百万行的巨蟒。我希望根据以下三个条件从第一个数据帧中删除行，该数据帧包含单词(以秒为单位)：如果单词出现在句子开头的一行如果单词出现在句子末尾的一行如果单词出现在句子的中间一行(确切的单词，而不是子集) 示例：第一个Dataframe： This is the first sentence Second this is another sentence This is the third sentence forth This is fifth sentence This is fifth_sentence 第二个Dataframe： Second forth

浏览 1提问于2021-06-11得票数 1

回答已采纳

1回答

合并两个数据帧后的NaNs

python、pandas

我有两个数据帧，如下所示： df1 id name ------------------------- 0 43 c 1 23 t 2 38 j 3 9 s df2 user id -------------------------------------------------- 0 222087 27,26 1 1343649 6,47,17 2

浏览 6提问于2017-03-14得票数 1

回答已采纳

1回答

丢弃len >2的每一行Pandas python

python、pandas、drop

假设我有一个数据帧 . Values 0 25 1 897 2 48 3 28 4 214 5 25 我尝试使用以下代码删除len >2的所有行，但在运行它时没有任何反应。 import pandas as pd df = pd.read_csv('File.csv') for index in df.index: if len(df.loc[index, 'Sevens']) > 2: df.drop([index]) else: pass

浏览 15提问于2020-10-25得票数 1

回答已采纳

3回答

pandas使用自定义函数按索引对行进行排序

python、pandas

我经常需要处理数据帧，其中的行名(pandas中的索引)类似于[a-z][0-9]+类型(例如，'a20'，'a21'，...或'b1'，'b11'，'b2'，...) 我希望能够仅根据数字对行进行排序。根据我对该应用程序接口的了解，df.sort_index()不接受我可以定义排序函数的函数参数。有没有一种巧妙的方法来实现这一点，而不是在创建数据帧时删除开头的字符？

浏览 1提问于2018-02-06得票数 2

2回答

python pandas获取列值的第一个数字

python、pandas、indexing、digits

我需要为daframe的每一行获取存储在另一个索引(或reset_index()之后的列)中的数字的前两位。我该怎么做呢？我的数据帧： value index1 110202 1 223168 5 850484 2 298008 3 950000 6 113500 6 849464 2 849616 10 我想获取的信息是： value index1 new_value 110202 11 1 223168 22

浏览 0提问于2019-11-15得票数 3

回答已采纳

1回答

如何从指定的行号迭代Pandas数据

python、pandas、dataframe

我正在使用df.iterrows()函数迭代一个dataframe，但不确定如何指定要在dataframe中运行的行号。我使用初始for循环中的行计数器(下面)搜索行内的X，一旦找到X，就需要遍历其余的数据帧以找到Y，但不需要循环遍历搜索X时已经循环过的初始行。我试图通过删除X之前的所有行来实现这一点，但是这不起作用，因为在找到初始的X和Y之后，它会删除我需要的条目，并且我需要找到下一个X和Y。 row_count = 0 for index, row in new_df.iterrows(): if X in row[2]: row_count +

浏览 2提问于2022-08-23得票数 2

2回答

pandas -将df.index从float64更改为unicode或字符串

python、pandas、indexing、dataframe、rows

我想将数据帧的索引(行)从float64更改为字符串或unicode。我以为这能行得通，但显然不行： #check type type(df.index) 'pandas.core.index.Float64Index' #change type to unicode if not isinstance(df.index, unicode): df.index = df.index.astype(unicode) 错误消息： TypeError: Setting <class 'pandas.core.index.Float64Index'&g

浏览 5提问于2016-02-13得票数 71

回答已采纳

1回答

更新dataframe会更新整个列，而不是行

python、pandas

我将csv作为数据帧导入，然后更新数据帧中的列并将其导出到新的csv文件。但是，第一个update语句似乎更新了整个列的所有行(而不仅仅是该行)。在遍历数据帧时，我将df.at与索引一起使用，因此我不知道自己做错了什么。任何帮助都将不胜感激。 import pandas as pd import numpy as np # import spreadsheet data df = pd.read_csv('C:\\Users\\admin\\Documents\\Projects\\data\\data.csv', dtype=str) df = df.replace(

浏览 10提问于2020-06-11得票数 0

回答已采纳

1回答

在"，“上连接3D pandas数组中的值，使其成为2D数组

python、pandas、dataframe、multidimensional-array

我有一个3D数据帧，我想得到z轴上一个x，y索引的所有值，这里的z轴在原始2D数据帧之间移动。我能够想象它的方式，尽管如果我错了，请原谅，因为可视化有点奇怪，如果我得到一个x，y的向量，x=0，y=0，它会是1，5，3。因此，我的结果将是一个数据帧，其中的df_2d将是一个字符串"1，5，3"，依此类推，获取3D数据帧中的所有值。有没有什么方法可以在不遍历每个单元格索引并显式访问值的情况下实现这一点？数据帧定义为： import pandas as pd columns = ['A', 'B'] index = [1, 2, 3] d

浏览 12提问于2019-04-11得票数 1

回答已采纳

1回答

Python:使用熊猫匹配替换部分文件路径

python、pandas、loops、for-loop、filepath

数据帧有2列：old_path和new_path。数据帧可以包含数百行。该脚本遍历文件列表。对于列表中的每个文件，请检查其文件夹路径的任何部分是否与old_path列中的值匹配。如果匹配，则将文件的匹配old_path替换为相应的new_path值。我使用for index, row in df.iterrows():或for row in df.itertuples():实现了这一点，但我认为应该有一种更有效的方法来完成它，而不必使用第二个for循环。任何帮助都是非常感谢的。下面的示例使用df.iterrows() import pandas as pd import os df

浏览 0提问于2018-11-20得票数 2

2回答

将所有值字符串列数据帧与其他数据帧字符串列进行匹配

python、pandas

我有两个熊猫数据帧：数据帧1： ITEM ID TEXT 1 some random words 2 another word 3 blah 4 random words 数据帧2： INDEX INFO 1 random 3 blah 我想要将( dataframe 2的) INFO列的值与dataframe 1的TEXT列进行匹配。如果匹配，我希望看到一个新的列带有"1“。如下所示： ITEM ID TEXT MATCH 1 some random words

浏览 8提问于2020-03-11得票数 1

回答已采纳

1回答

模糊匹配数据框中的值，然后替换该值的最佳方法？

python、pandas

我正在处理一个包含客户数据的各种数据点的数据帧。我希望从本质上将任何垃圾电话号码替换为空值，目前我正在努力寻找一种有效的方法来找到潜在的垃圾电话号码，例如111-111-1111这样的电话号码，并将该特定值替换为空白条目。我目前有一个相当难看的解决方案，我正在遍历3个字段；家庭电话，手机和工作电话，定位有问题的行和相应列的索引值，然后替换这些字段，关于在数据帧中实际查找垃圾值，有没有比我目前正在做的更好的方法？ row_index = dataset[dataset['phone'].str.contains('11111')].index column_

浏览 9提问于2020-04-23得票数 2

回答已采纳

1回答

使用apply在pandas中添加多个列

python、pandas、dataframe

我正在尝试对数据帧中的一列运行函数(row_extract)，该函数返回三个值，然后我想将它们添加到三个新列中。我试过这样运行它 all_data["substance", "extracted name", "name confidence"] = all_data["name"].apply(row_extract) 但是我得到一个包含所有三个值的列。我将遍历行，但这似乎不是一个非常有效的系统-有什么想法吗？这是我目前的解决方案，但它需要一段时间。 for index, row in all_data.iterrows(

浏览 27提问于2020-04-23得票数 2

2回答

R检查dataframe中是否存在元素，并返回其索引

我有一个数据帧，如下所示 index id 1 abc;def;ghi;jkl;mno 2 bcd;efg;hij;klm;nop 3 cde;fgh;ijk;lmn;opq . . . 我想使用R来查找"abc“是否在数据帧中，并返回它的索引。我尝试将'id‘列划分为5个不同的列，并找出"abc“是否在每一行中。但是我的数据集包含大约200,000行。遍历每一行都需要很长时间。我想知道是否有更有效的方法来检测它。例如，"abc“是df$id1的一部分，那么结果应该返回1；"cde”应该返回3。

浏览 1提问于2019-04-24得票数 0

1回答

Pandas dataframe.drop随机删除行

python、pandas、dataframe

基于一系列条件，我正在尝试从Pandas数据帧中删除不需要的行。我对每组条件都有一个drop语句-总共有10个条件。但是，行是随机删除的。每次我在不应删除任何行的测试用例上运行代码时，都会删除不同数量的行。我尝试使用inplace=True删除，但仍然会随机删除行。我尝试注释掉除第一个语句之外的所有drop语句--只使用一个drop语句仍然会导致随机删除的行。当我在我的PC上本地运行时，这段代码似乎运行得很好。但是，我需要在服务器上运行它。服务器上安装了更新版本的Python和Pandas。我尝试在服务器上使用与我在PC上使用的相同版本的Python和Pandas，但仍然收到随机丢弃的行。

浏览 250提问于2021-11-12得票数 0

5回答

从dataframe返回值

python、pandas、dataframe

我有这样的python大熊猫数据帧，有200到400 k行。 Index value 1 a 2 3 v 4 5 6 6077 7 8 h 我希望这个dataframe值列使用基于字符串值数的特定值填充所有下面的行(就像这里的这个表中有一个字符串值)。我要我的数据就像这样。 Index value 1 a 2 a 3 v 4 v 5 v 6 v 7 v 8 h

浏览 2提问于2020-11-03得票数 1

回答已采纳

1回答

如何在Dask中获取从拼图文件读取数据帧的单行值？

python、dask

问题: DASK数据帧 loc[concrete_row, concrete_column] 返回多行的pandas数据帧，每行都有相同的索引： 0 [1,2,3] 0 [1,2] 0 [3] 而不是一个行值。 0 [1,2,3] 我正在阅读许多拼图文件： dd.read_parquet(dataset_dir+'/train/date*/*.parquet') 拼图文件中的每一行都有一个数组！似乎在调用具体行时，dask data

浏览 48提问于2019-06-05得票数 0

2回答

获取数据帧的所有单元格作为(索引，列)的元组，以便传递给df.apply()

python、pandas、dataframe、indexing

我想要获取Pandas数据框中每个单元格的索引和列名。例如，在由以下代码生成的数据帧中 df = pd.DataFrame({1 : np.arange(1, 6), 2 : np.arange(6, 11), 3 : np.arange(11, 16), 4 : np.arange(16, 21), 5 : np.arange(21, 26)}, index=[1, 2, 3, 4, 5]) 我想访问一个由value的行索引和value的列

浏览 0提问于2016-01-31得票数 1

3回答

如何拆分包含多个条目的数据帧字典？

python、python-3.x、pandas

嗨，我有下面这本字典 str1 x y a 1.0 -3.0 b 2.0 -2.5 str2: x y a 3.0 -2.0 b 4.0 -1.5 str3: x y a 5.0 -1.0 b 6.0 -0.5 我希望的结果是能够拆开它的堆栈，这样我就可以使用index=[str1,str2,str3]和columns=[a,b]获得数

浏览 23提问于2019-01-09得票数 0

1回答

将pandas数据帧的多行合并到一行中，根据初始行中的值向该行添加新列的最有效方法是什么？

python、pandas

我有一个熊猫数据框架，由人口统计属性和调查问题和答案组成。问题是多项选择和多项选择。初始数据帧中的每一行表示单个问题的单个答案。因此，每个受访者和每个问题都有多行。初始数据帧如下所示： user_id question answer age gender 1 question_1 answer3 34 male 1 question_1 answer5 34 male 1 question_2 answer1 34 male 1 question_2 answer4 34 male 2

浏览 2提问于2017-04-30得票数 2

1回答

如何使用正则表达式删除python pandas DataFrame中的行？

python、regex、pandas

我有一个模式： patternDel = "( \$(MoM|QoQ)\$)"; 我想删除pandas dataframe中列df['Event Name']与此模式匹配的所有行。哪种方法是最好的？数据帧中有超过100k行。

浏览 8提问于2016-10-10得票数 26

回答已采纳

2回答

如果pandas中包含某些特定字符，则用另一个单词替换该单词

python-3.x、pandas

我想替换Pandas数据帧中包含某些字符的单词。 pd.Series(['first mashmalowss ', 'second', 'third row', 'fourth powwww']) 我想将包含“ow”的单词替换为“value”。预期输出： pd.Series(['first value ', 'second', 'third value', 'fourth value']) 实际上，第1、3和4行的值都有一个字符为“ow”的单词。

浏览 32提问于2019-11-11得票数 1

回答已采纳

1回答

使用for语句从dataframe追加列表

python、pandas、list、dataframe、append

在学校学习Python。在一个项目中工作，我想从一个数据帧中删除特定的行，并将其转换为另一个数据帧。我有一个372个动物的列表，如果它们的名字出现在数据帧中(它有1288行，每行是不同的动物)，我想删除该行。因此，我找到了一个删除行的解决方案： ess_aza = [] for i in aza_names: if True: ess_aza.append(ess_clean.loc[ess_clean['scientific_name'] == i]) else: return 打印出来的列表是这样的： [Empty Dat

浏览 20提问于2020-10-25得票数 2

回答已采纳

1回答

以这样的方式合并列:具有重复元素的行用逗号分隔

python、python-3.x、pandas、numpy

这是我拥有的输入数据帧。 ? 这是我想要的输出： ? 如您所见，两个数据帧在列Key1上以逗号分隔的方式合并，其中包含公共元素的行用逗号分隔。我尝试过使用merge，但它不能给出正确的输出。 mer = pd.merge(df,df, on='Key1', how='inner') 有没有具体的方法来解决这个问题？

浏览 9提问于2021-01-18得票数 2

回答已采纳

3回答

数据帧列表，如果行包含特殊字符串，则删除数据帧列(列具有不同的名称

python、pandas

我有一份数据帧列表。重要的是要注意的是，数据帧的形状在2-7列之间不同，并且这些列的名称在该列的0和len之间(例如，df1有5列，名为0,1,2,3,4等等。df2有4列，名为0,1,2,3) 我想要的是检查列中的一行是否包含某个字符串，然后删除该列。 list_dfs1=[df1,df2,df3...df100] 到目前为止，我所做的是下面的&我得到了一个错误，第5列不在轴上(它在一些DF中) for i, df in enumerate(list_dfs1): for index,row in df.iterrows(): if np.where(ro

浏览 12提问于2020-10-18得票数 3

回答已采纳

1回答

将字典附加到数据帧

python、pandas、dataframe

python新手。我正在读取源数据帧中的行，并尝试将其附加到目标数据帧中。下面是读取每一行原始数据的程序主代码。 for i,row in raw_data.iterrows(): tool=row['entity'] shift=row['shift_info'] time=row['time_delta'] set_flag (tool,shift,time,raw_data,Display_data) 然后，我构造一个字典，将其附加到目标数据帧。 def set_flag(tool,shift,time,ra

浏览 1提问于2014-03-10得票数 1

1回答

如何迭代csv文件的各行并根据特定列的值进行删除

python、csv、pandas、jupyter

基本上，我需要从csv文件中删除某些行，其中' county‘列的值不包含单词county。我试图把它放回我的数据框中，但是，我得到了一个索引错误。 chd = pd.read_csv('some_file.csv') for index, row in chd.iterrows(): if 'County' not in row['County']: chd = chd.drop(chd.index[[index,3]]) 我得到以下错误： IndexError:索引2959超出了大小为2909的轴1的边界给

浏览 0提问于2016-02-16得票数 2

2回答

如何使用iloc[]选择熊猫数据帧的倒数第二行？

python、python-3.x、pandas、dataframe、row

我从网上获取数据，并将这些数据存储在pandas数据帧中。但问题是数据帧的格式并不是每次都相同，主要是行数。 Print(df.shape) Output: (100, 9) -- Print(df.shape) Output: (33, 9) -- Print(df.shape) Output: (153, 9) -- Print(df.shape) Output: (148, 9) 您能告诉我如何使用iloc[]只选择倒数第二行或倒数第二行的任意特定单元格吗

浏览 140提问于2021-03-26得票数 0

1回答

如何迭代数据帧中的每一行而不将每个索引应用于每一行？

python、loops、pandas

如何迭代数据帧中的每一行而不将每个索引应用于每一行？ >>> d2 = {'one' : pd.Series(['us 1','uk 2','china 3','india 4'], index=['a', 'b', 'c','d'])} >>> df2 = pd.DataFrame(d2) >>> df2 one a us 1 b uk 2 c china 3 d india 4

浏览 4提问于2015-12-04得票数 2

回答已采纳

1回答

如何使代码在速度方面更有效率

python、pandas、algorithm、performance、parallel-processing

假设我们有一个名为pickle_list.pkl的pickle文件，其中包含23个熊猫数据帧。此外，df_combined是所有这些数据帧的串联。假设df_combined的形状是(1000000, 5000)。有没有更有效的方式来运行下面的代码块？也许某种类型的并行化可以起作用？现在它在第69000行，并且已经运行了一天。 import pickle import pandas as pd df_list = pd.read_pickle(r'pickle_list.pkl') df_combined = pd.concat(df_list, ignore_index=T

浏览 9提问于2021-07-09得票数 0

回答已采纳

1回答

检查pandas数据帧是否正确增加？

python、pandas、dataframe

我想验证数据帧的列中是否有离群值，知道它肯定是在增加或减少例如，数据帧df_bad正在增长，其数据如下： df_bad = pd.DataFrame([1,2,-3,1,5,8,7],index=[0,10,20,30,40,50,60]) 应将正确的数据帧更正为： df_correct = pd.DataFrame([1,2,3,4,5,6,7],index=[0,10,20,30,40,50,60]) 在标识索引20、30和50不正确的情况下，由于行df_bad.loc[20]的值小于前一行的值，行df_bad.loc[30]的值大于其前一行，然而，不大于最高校正值(df_bad.lo

浏览 6提问于2021-08-13得票数 1

3回答

在R中有没有一个函数可以删除数千行给定的特定内容？

r、rows

我有一个大约有20,000行的数据帧(称为TLSWL)。我在df中有一个用于Time的列，我需要删除在特定分钟内结束的所有行。我只需要30分钟的时间增量就可以匹配其他数据进行比较。这就是我目前使用的： TLSWL<- TLSWL[TLSWL$Time != "0:06"&TLSWL$Time !="0:12"&TLSWL$Time !="0:18"&TLSWL$Time !="0:24"&TLSWL$Time != "0:36"&TLSWL$Time

浏览 18提问于2019-08-27得票数 2

4回答

使用值列表从dataframe中选择行

python-3.x、pandas、dataframe

我有一个值列表，我希望使用这些值来选择数据帧中的行。诀窍是，我希望选择列表值在该行中的任何行。示例： index color shape 1 blue star 2 red square 3 yellow circle 我的名单是 list_vals = ['sq', 'blu'] 我想选择行 index color shape 1 blue star 2 red square

浏览 0提问于2019-04-17得票数 2

回答已采纳

2回答

如何对具有相似名称的行求和

python、pandas、dataframe

我有一个数据帧，看起来像这样 ? 每一行都有自己的副本，前缀为“treatment_group”，但系数不同。如何使用以下逻辑通过coef对整个数据帧中的这些行求和: sum = treatment_group: feature 19 + feature 19？

浏览 27提问于2021-09-20得票数 0

回答已采纳

2回答

Pandas数据框行删除

pandas

我正在尝试修复csv文件。根据几个条件，需要删除一些数据行。假设您有以下数据帧： -A-B-C 000-0-0 000-1-0 001-0-1 011-1-0 001-1-1 如果两行或更多行有共同的列A，我希望将列B设置为1的行保持不变。生成的数据帧应如下所示： -A-B-C 000-1-0 011-1-0 001-1-1 我已经尝试了merges和drop_duplicates，但似乎无法获得所需的结果。不确定列B=1的行会在B= 0的行之后。drop_duplicates的take_last论点似乎很吸引人，但我不认为它适用于这里。我们将非常感谢您的任何建议。谢谢。

浏览 0提问于2014-02-27得票数 0

2回答

在pandas dataframe中，删除一个值以另一个行的值开始的行的方法更为简单

python、pandas

我正在处理一个pandas数据帧，如果它们包含的“完整路径”已经包含在数据帧的其他“完整路径”中，则希望删除这些行。在下面的示例中，我想删除行1、2、3、4，因为c:/dir/“包含”它们(我们在这里讨论的是文件系统路径)： Full Path Value 0 c:/dir/ x 1 c:/dir/sub1/ x 2 c:/dir/sub2/ x 3 c:/dir/sub2/a x 4 c:/dir/sub2/b x 5 c:/anotherdir/ x 6

浏览 21提问于2020-09-14得票数 1

2回答

如何在给定数据帧中的值或索引列表的情况下对数据帧进行掩码

python、pandas、dataframe

我有一个数据帧，它有一列'rel_max‘，其中包含所有局部最大值的列表(如果相关或更有用的话，我还有一列这些局部极值的索引)。我想要获取这个值或索引的列表，并对数据帧进行掩码，以便在其正确的位置有一个最大值，对于数据帧的所有其他值，我有一个NaN或0。 df = pd.DataFrame({'123': [20.908, 8.743, 8.34, 2.4909], '124': [2, 2.34, 0, 4.1234], '412': [2, 20.123, 3.12

浏览 5提问于2019-07-19得票数 0

回答已采纳

3回答

合并特定列上的重复行

python、pandas

我正在尝试合并数据帧的行，以防在一列中存在重复项。数据帧如下所示。 Name Code X Y A 123 10 11 B 456 12 13 C 123 15 16 我想结合在代码上。因此，如果代码是相同的，则用逗号分隔其他数据。生成的df将如下所示： Name Code X Y A,C 123 10,15 11,16 B 456 12 13 我的方法如下： df = df.groupby(['Name','Code',&

浏览 29提问于2019-03-12得票数 3

回答已采纳

2回答

从pandas dataframe中删除句子长度超过特定词长的行

python、string、pandas、split

我想从pandas dataframe中删除行，该数据帧包含长度大于所需长度的特定列中的字符串。例如：输入帧： X Y 0 Hi how are you. 1 An apple 2 glass of water 3 I like to watch movie 现在，假设我想从dataframe中删除包含长度大于或等于4的单词字符串的行。所需的输出帧必须为： X Y 1 An apple 2 glass of water 当列0中的字数为4和列3中的字数分别为5时，删除列'X‘中值为0、3的行。

浏览 144提问于2019-06-12得票数 9

回答已采纳

3回答

Pandas数据帧使用列逻辑对行进行重复数据消除

python-3.x、pandas、dataframe

我有一个大约有1亿行的熊猫数据帧。我对消除重复数据很感兴趣，但有一些标准我还找不到相关文档。我想要对数据帧进行重复数据消除，忽略其中一列会有所不同。如果该行是重复的，除了那一列之外，我只想保留具有特定字符串的行，比如X。示例数据帧： import pandas as pd df = pd.DataFrame(columns = ["A","B","C"], data = [[1,2,"00X"], [1,3,"010"]

浏览 27提问于2020-09-04得票数 2

回答已采纳

1回答

如何使用apply、map或applymap在pandas数据帧中找到每个行和列数据类型？

python、pandas、dataframe、complex-data-types

我有如图所示的数据帧。我希望每个行和列的数据类型都使用apply/map/applymap。如何获取此数据类型？有些列具有突出显示的混合数据类型，例如list和str，有些列具有list和dict。 1

浏览 29提问于2021-11-10得票数 3

回答已采纳

1回答

获取字符串中某个单词的频率的通用函数

我试图写一个函数，从一些文本中获取特定单词的频率。然后使用此函数计算数据帧中每一行所选字的频率。到目前为止，我所做的是创建一个函数，该函数接受字符串和模式的输入(即str，模式)。由于grep捕获字符串中的所有模式，我觉得length将负责捕获所选模式的频率。 word_count = function(str,pattern) { string = gsub("[[:punct:]]","",strsplit(str," ")) x = grep("pattern",string,value=TRUE) re

浏览 0提问于2019-04-26得票数 1

回答已采纳

3回答

Pandas根据外部序列对数据帧进行排序

python、pandas、dataframe

假设我有以下数据帧： df = pd.DataFrame({'id': [1,2,3,4,5,6,7,8,9,10], 'name': ['a', 'nkjnkj', 'oijhoiuh', 'on', 'lnjjn', 'kmlkm', 'molijoijoij', 'kljkljhlh', 'ghkghgj', 'ihkjhkj']}) 我想按名称的长度对其进行排序，我可以这样做： df['

浏览 12提问于2020-10-02得票数 1

回答已采纳

1回答

Pandas，检查一列中是否包含另一列中的字符，并将该字符标记出来？

python、pandas、dataframe

有两个数据帧，df1和df2。例如： df1 = pd.DataFrame({'index': [1, 2, 3, 4], 'col1': ['12abc12', '12abcbla', 'abc', 'jh']}) df2 = pd.DataFrame({'col2': ['abc', 'efj']}) 我想要的内容如下所示(从df2中找到包含字符的所有行，并将它们标记出来) index c

浏览 221提问于2021-03-22得票数 1

回答已采纳

3回答

如何将数据字典转换为数据字典？

python、python-3.x、pandas、python-2.7、numpy

我有一个包含多个键的字典，它有一个值，一个数据框架，如下所示，可以有不同数量的索引。 'key1': colB colA str1 3 str2 4 str3 5 'key2': colB colA str2 3 str3 4 str5 5 'key3': colB colA str4

浏览 0提问于2018-12-28得票数 0

回答已采纳

2回答

Pandas获取dataframe A中包含dataframe B的子字符串的所有行

python、pandas、dataframe

所以我有两个数据帧，数据帧1： ? 数据帧2： ? 我想要获取数据帧2中包含columnB的子字符串的dataframe1中的所有行： ? 我正在使用df1['columnA'].isin(df2['columnB'])，但是我不能让它工作。我应该如何实现这一点？

浏览 88提问于2020-07-29得票数 0

回答已采纳

2回答

删除.csv文件中的逗号时出现键错误

python、pandas

数据：数据帧如下所示：我正在尝试删除第一行中的逗号(有一些类似于‘1000’的内容) 但是有一个关键的错误：“价格” 代码： import pandas def main(): df=pandas.read_csv("Rent_Message.csv",index_col=0) df=df.drop(df.columns[df.columns.str.contains('Unnamed',case = False)],axis = 1) df['Price'] = df['Price'].str

浏览 13提问于2018-09-08得票数 0

回答已采纳

1回答

拆分数据帧的行，并将它们作为单个行存储在同一数据帧中

python、regex、python-3.x、pandas、dataframe

我有一个数据帧，可以使用下面给出的代码创建它 df = pd.DataFrame({'Person_id':[1,2,3,4], 'Values':['father:1.Yes 2.No 3.Do not Know','Mother:1.Yes 777.No 999.Do not Know','sons:1.Yes 2.No 321.Do not Know','daughter:1.Yes 567.No 3.Do not Know'], 'Ethnicity':['dff

浏览 42提问于2019-06-11得票数 1

回答已采纳

1回答

在条件搜索中使用loc搜索数据帧中一系列字符串内的拆分字符串的长度

python、pandas

我有一个数据帧df A 0 Foo 1 Foo Bar 2 Foo,Bar,Quux 3 FooBar Qux,Quux 我想使用loc查找行，如下所示： df.loc[(len(df['A'].str.split(',')) > 1)] 要检索行，请执行以下操作： 2 Foo,Bar,Quux 3 FooBar Qux,Quux 但是，这种语法不起作用。在这种情况下，loc的正确语法是什么？

浏览 10提问于2021-02-11得票数 0

回答已采纳