Pandas:删除列表中包含的所有行_删除所有包含Year != Pandas的行_pandas如何使用iloc删除所有包含false的行 - 腾讯云开发者社区

python-3.x、pandas、dataframe、group-by

我有一个Pandas，包含2列，都有连续整数。在逐行的基础上，通过将col_1中的所有相等值分组，我试图在col_2中创建所有值的列表，不包括所讨论的行，并将其存储在一个新列(col_3)中。以下是完整的例子：当前数据： col_1 col_2 24 30 24 22 24 34 40 50 所需数据： col_1 col_2 col_3 24 30 [22,34] 24 22 [30,34] 24

浏览 6提问于2022-10-30得票数 0

回答已采纳

1回答

组合一个数据文件列表

python-3.x、pandas、indexing、concat

我有一个有几个..csv文件的文件夹。每个包含数据的时间，高，低，开放，Volumefrom，Volumeto，加密货币关闭。我成功地将.csvs加载到一个数据文件列表中，并删除了列Open、High、Low、Volumefrom、Volumeto，这是我不需要的，给我留下了时间，并关闭了每个数据帧。现在我想把数据列表组合成一个数据，索引以最小的硬币的时间戳开始，在这个例子中是iota。这是我到目前为止编写的代码： import pandas as pd import os # Path to my folder PATH_COINS = r"C:\Users\...\C

浏览 1提问于2018-09-25得票数 0

1回答

获取Pandas DataFrame中每行非零值的计数

python、pandas

我知道这是个简单的问题，但我对潘达斯很陌生。我想对每一行的单元格进行比较，以查看列中的任何单元格是否大于或小于0.00。 GOOG AAPL XOM IBM Value 2011-01-10 0.0 0.0 0.0 0.0 0.00 2011-01-13 0.0 -1500.0 0.0 4000.0 -61900.00 我知道熊猫是在迭代中建造的。但是，使用下面的代码，我收到了一个错误 for index, row in dataFrame.iterrows():

浏览 2提问于2017-10-15得票数 5

回答已采纳

2回答

特定列中所有行的总和

python、pandas

我正在尝试生成pandas中特定列中所有行的总和。我正在使用jupyterhub笔记本做这个项目。下面的代码生成一个完整的列表，其中包含每行中的值，而不是所有行的总和。想知道我做错了什么吗？ ria_aum_total = ria_aum['5F(2)(a)'].sum() print(ria_aum_total)

浏览 17提问于2021-04-23得票数 0

回答已采纳

2回答

如何避免pandas的concate和to_csv函数中的空集？

python、pandas

我有一个通过pandas存储在csv中的字典： df = pd.concat([pd.Series(node_dict[k], name=k) for k in HEADERS], 1) df.to_csv(os.path.join(abspath, outputfile), sep='\t', index=False) 关键点对应于CSV或pandas框架中的列，值是集合的列表。每个集合都是当前行的值。让我们看看我是否有两列： names companies {'john

浏览 19提问于2020-03-26得票数 0

3回答

如何在pandas DataFrame中拆分包含嵌套数组的单元格

pandas、jupyter-notebook

我有一个pandas DataFrame，它包含610行，每一行都包含一个坐标对的嵌套列表，它看起来像这样： ? 1377778.4800000004,6682395.377599999是一个坐标对。我想取消每一行的嵌套，因此我将为每个坐标对分配一行，而不是包含一系列坐标，即： ? 我试过这个问题Split nested array values from Pandas Dataframe cell over multiple rows中的s.apply(pd.Series).stack()，但不幸的是这不起作用。有什么好主意吗？首先要感谢大家！

浏览 36提问于2019-10-04得票数 0

回答已采纳

1回答

Pandas将列的列表元素的值分布到n个不同的列中

python、pandas、data-science、data-cleaning

我有一个包含一个列名为RecentDelays的Pandas DataFrame，其中包含一个元素列表。需要将此RecentDelays列分解为N个不同的列，如Delay1，Delay2，....with对应行的Delay1列中的list的第一个值，对应行的Delay2列中的第二个值，依此类推.If没有第n个值，它应该为NaN

浏览 0提问于2018-06-12得票数 2

1回答

在python中处理.csv

python、performance、search、optimization

我是python的新手，我正在做一个小项目，这样我就可以学到更多。我想读取任意大小的.csv文件，文件A，但只将每行的第三列存储到列表X中。然后，我想检查另一个任意大小的.csv文件，文件B的每一行是否与列表1中的每个值相匹配。文件B的行数始终是文件A的200倍左右，每行32个元素，但我只对检查文件B的第11列中的匹配项感兴趣。当我找到一个匹配项时，我使用该行的索引将文件B中的整个行添加到一个新的2d列表list Y中，该列表包含所有32个元素。我已经成功地将这两个文件读入到它们自己的列表中，并创建了一个包含文件B的列表中的第11个元素的新列表，我还通过简单地检查每个元素是否匹配，成功地输出

浏览 0提问于2020-10-09得票数 0

1回答

根据另一个DataFrame中的条件表达式从pandas dataframe中删除行

python、pandas、dataframe、nan

我有两个pandas数据帧，df1和df2，它们的行数相等。df2有11行，其中包含NaN值。我知道如何删除df2中的空行，方法如下： df2.dropna(subset=['HIGH'], inplace=True) 但是现在我想从df1中删除这些相同的行(从df2中删除的行号相同的行)。我尝试了以下方法，但似乎不起作用。 df1.drop(df2[df2['HIGH'] == 'NaN'].index, inplace=False) 还有其他建议吗？

浏览 0提问于2020-09-21得票数 0

1回答

TypeError:当我在熊猫查询中使用Series.str.len()时，无法理解的类型：'numpy.ndarray‘？

python、pandas

我遇到了一个问题，当我在熊猫查询方法中使用Series.str.len()时，实际上我的env中不支持Series.str的所有函数，而是在其他envs中工作，所有这些env都有几乎相同版本的熊猫和numpy。(我相信Series.str.xxxxx以前能在我所有的env中工作) Env1 Python 3.9.7 numpy==1.21.4 pandas==1.3.4 当我运行pd.DataFrame(columns=['core_text']).query("core_text.str.len()>1")时，文件回溯(最近一次调用)：文件"&

浏览 5提问于2022-01-13得票数 1

1回答

Pandas:用于获取包含不在指定列表中的字符的行的过滤器

python、pandas

假设这是我的列(数据类型为字符串) '83.83' '334-339.99' '45' '(34.23)' 'R34.2' 我想要过滤，以便仅包含不在此列表中的字符的行 ['1', '2', '3', '4', '5', '6', '7', '8', '9', '0', 'R', '.'] 所以我只会得到这些行 '3

浏览 33提问于2021-02-05得票数 0

回答已采纳

4回答

熊猫数据过滤器不工作，但str.match()正在工作

python、pandas、dataframe

我有一个Pandas words_df，其中包含一些英语单词。它只有一个名为word的列，它包含英文单词。 words_df.tail() words_df.dtypes 我想过滤掉包含单词zythum的行。使用Pandas系列str.match()给出了预期的输出： words_df[words_df.word.str.match('zythum')] 我知道str.match()不是正确的方法，它还会返回包含其他单词(例如zythum)的行。但是，在Pandas Dataframe上使用下面的操作将返回一个空的Dataframe word

浏览 8提问于2020-05-24得票数 2

回答已采纳

1回答

在Python中使用列名和行名创建矩阵

python、pandas

我是Python的新手。我想创建一个m x n矩阵，并在它的列和行中添加名称。我有一个包含行名称的列表和一个包含列名称的列表。似乎我需要用"Pandas“。但是我不知道如何使用它。有人能帮我吗？

浏览 0提问于2014-10-03得票数 1

3回答

用熊猫从导入的CSV文件创建列表

python、pandas、csv

我正试图从CSV中创建一个列表。这个CSV包含一个二维表540行和8列，我想要创建一个列表，其中包含一个特定列的值，第4列是特定的。我尝试了: list(df.columns.values)4，它确实提到了列的名称，但是我试图从列4上的行中获取值，并将它们变成一个列表。 import pandas as pd import urllib #This is the empty list company_name = [] #Uploading CSV file df = pd.read_csv('Downloads\Dropped_Companies.csv') #Ex

浏览 5提问于2022-03-23得票数 1

回答已采纳

1回答

按日期索引对齐多个熊猫系列

pandas、dataframe、time-series

我有n个pandas series。他们大多拥有相同数量的数据，但并非总是如此。 print(str(len(dfS1))) print(str(len(dfS2))) print(str(len(dfS3))) print(str(len(dfS4))) 3025 3026 3025 3026 我需要确保每一天行都正确地对齐，例如： dfj = dfS1.join(dfS2, how='outer', rsuffix='_1').join(dfS3, how='outer', rsuffix='_2').join(dfS4,

浏览 0提问于2019-02-06得票数 0

回答已采纳

3回答

如果熊猫列表中的项是字典键，则用值替换，如果不在字典中，则删除

python、pandas

如果熊猫列包含列表，则可以使用字典将所有值转换为 df['listColumn'] = df['listColumn'].apply(lambda x: [columnDictionary[i] for i in x]) 但是，在某些情况下，并非列表中的所有项都是字典的键。在这种情况下，您如何用任何东西替换这些项目。例如 columnDictionary = {a:1, b:2, d:7, f:8 } 具体Pandas行/列: a、b、c、d、e 转换后的特定Pandas行/列: 1、2、7

浏览 2提问于2019-08-25得票数 1

回答已采纳

4回答

python文件读取:将第一行转换为列标题，下一步(读取器)返回不需要的字符

python、pandas、csv

目前，我正在编写一些代码，以便与熊猫一起在csv文件中读取，我需要将文件的第一行读入列表中，以便将其用于一些描述符(参见代码Part1)。我只需使用pandas.read_csv参数header=0，它自动读取列标题，但它不返回list afaik。在print()中的注释中，名称是我用来手动将列标题传递给print()的列表，但我希望它是自动的(因此，当我添加/删除列时，不必手动编辑名称数组)。因此，为了解决这个问题，我想出了一个想法，只需在第一行中使用csv.reader单独阅读，然后获得一个列名，其中包含我可以在pandas.read_csv中以这种方式使用的列名(参见代码Part2)

浏览 0提问于2019-01-22得票数 1

2回答

Pandas使用lineterminator='\n‘保存到csv

python、pandas、csv

我正在尝试将包含文本信息的文件保存为csv格式。然而，在我在pd.read_csv中使用'to_csv‘之后(没有指定任何东西)保存文件，然后我使用pandas重新打开该文件。它将显示以下错误消息： ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file. 但是如果我阅读像pd.read_csv('file.csv'，lineterminator='\n')这样的pandas格式的csv文件。它将正确地打开文件

浏览 98提问于2020-09-12得票数 0

1回答

选择具有可变标头的csv/df中的特定列python

python、pandas、csv、dataframe、header

我有几个CSV文件，其中包含相同信息的变体。我想根据关键字从它们中的每一个中提取列。但是，每个文件的头不一定从第一行开始，这使得识别´skiprows=´的静态变量具有挑战性。以下是CSV的一些示例 CSV1 Here are the instructions that you should follow. Follow them closely, OK, to define the Type and Place. Type Number Place Exists cat 2 home yes dog 2 field yes fish 3 sea y

浏览 1提问于2018-05-04得票数 0

2回答

Python 2.7将两个值作为列表连接到两个不同列的同一行(来自csv文件)

python-2.7、list、csv、row、col

我有一个.csv文件，其中包含两个感兴趣的列‘纬度’和‘经度’，并填充了值我想返回两列中每一行的纬度、经度对作为列表... 10.222，20.445……以此类推，对于我的csv的每一行... > import pandas colname=‘纬度’，‘经度’data = pandas.read_csv('path_name.csv'，names=colnames)的问题 latitude = data.latitude.tolist() longitude = data.longitude.tolist() 它为每个纬度和经度列的所有值创建了两个列表如何在pytho

浏览 4提问于2017-06-26得票数 0

2回答

在R中是否有类似于complete.cases的等效Python函数

python、pandas

我正在删除pandas数据框架中的一些记录，该数据框架在4列框架中包含不同的NaN组合。我已经创建了一个名为complete_cases的函数来提供满足以下条件的行的索引:行中的所有列都是NaN。我已经尝试过下面的函数： def complete_cases(dataframe): indx = [] indx = [x for x in list(dataframe.index) \ if dataframe.loc[x, :].isna().sum() == len(dataframe.columns)] retu

浏览 32提问于2019-07-30得票数 1

2回答

如何在一列由numpy数组组成的列上使用条件来索引数据帧？

python、pandas

我目前有一个pandas dataframe，它有一列数值是numpy数组。我正在尝试获取数据帧的行，其中列的值是一个空的numpy数组，但我不能使用pandas方法进行索引。下面是一个数据帧示例。 data = {'Name': ['A', 'B', 'C', 'D'], 'stats': [np.array([1,1,1]), np.array([]), np.array([2,2,2]), np.array([])]} df = pd.DataFrame(data) 我尝试只获取‘KeyEr

浏览 18提问于2021-08-24得票数 0

回答已采纳

3回答

基于标点符号列表的数据帧标点符号替换

python、pandas、dataframe、large-data

使用Canopy和Pandas，我有数据帧a，其定义如下： a=pd.read_csv('text.txt') df=pd.DataFrame(a) df.columns=["test"] test.txt是一个单独的列文件，它包含包含文本、数字和标点符号的字符串列表。假设df看起来像：测试 %hgh&12 Abc123！猪肉薯条我希望我的结果是：测试 hgh12 abc123 猪肉薯条迄今所作的努力： from string import punctuation /-- import punctuation li

浏览 4提问于2014-02-10得票数 6

回答已采纳

1回答

删除另一个列表中的值行

python、python-2.7、pandas

我试图删除df中存在于lst中的列表中的值行。我知道对单数字符串使用df[df[x].isin(y)]，但不确定如何调整相同的方法来处理dataframe中的列表。 lst = ['f','a'] df Column1 Out1 0 ['x', 'y'] a 1 ['a', 'b'] i 2 ['c', 'd'] o 3

浏览 2提问于2017-10-12得票数 3

回答已采纳

2回答

从csv中读取特定列而没有Pandas推断标头

python、pandas、csv

我正在尝试读取木星笔记本中带有pandas.read_csv的csv文件中的特定列。我知道我感兴趣的数据从哪一行开始，并使用skiprows关键字转到该行，该行包含列标签。但是，即使我指定了我希望使用usecols的列，但Pandas只是从列中删除值，而不是从列本身删除值。因此，如果我的test.csv如下所示： *first 6 rows to be skipped* 1,2,3,4,5,6 a,b,c,d,e,f A,B,C,D,E,F 片段(导入正确的模块后) df = pandas.read_csv('test.csv', skiprows = 5, usecols

浏览 4提问于2020-01-30得票数 0

1回答

如何检查一个dataframe列中的值是否包含在另一个完整列中？

pandas、dataframe

在我的项目中，我需要检查整个dataframe列中是否存在一些值。示例dataframe： df=pd.DataFrame([['abc', 'a'], ['def', 'x'], ['aef', 'f']]) df.columns=['a', 'b'] >>>df a b 0 abc a 1 def x 2 aef f 这个静态代码运行良好： df['a'].str.contains('f')

浏览 0提问于2019-09-25得票数 1

回答已采纳

2回答

使用日期索引在pandas中删除一行，python

python、pandas

我正在尝试删除由python中的pandas创建的dataframe中的最后一行，但似乎遇到了麻烦。 index = DateRange('1/1/2000', periods=8) df = DataFrame(randn(8, 3), index=index, columns=['A', 'B', 'C']) 我尝试了drop方法，如下所示： df.drop([shape(df)[0]-1], axis = 0) 但它一直说label不包含在轴中。我也尝试使用索引名称，但它似乎仍然不起作用。任何建议都将不胜感激。谢谢！

浏览 0提问于2012-07-10得票数 5

回答已采纳

2回答

如何使用pyodbc在python中将列表用作SQL连接的参数

python、parameters、pyodbc

我正在学习python，并且我正在尝试传递一个参数作为WHERE子句的一部分。我使用的是pandas和pyodbc。这是我到目前为止尝试过的方法。我首先从pandas dataframe获取c列的数据，并将其转换为一个名为df_col的列表，该列表包含大约100个数值 df_col=df['data_for_colc'].tolist() 然后，我执行SQL语句： execu = mycursor.execute( """ Select columnA ,columnb ,columnc where columnc in (?) "&#

浏览 1提问于2018-01-25得票数 2

回答已采纳

6回答

如何在Pandas中获取数据帧中的行号和列号？

python、pandas

如何使用Pandas获取包含特定值的dataframe中的行数和列数？例如，我有以下数据帧： ? 例如，我需要知道"Smith“的行和列(行1，列LastName)。

浏览 125提问于2020-12-18得票数 0

2回答

将单个Pandas DataFrame行追加到列表并转换为矩阵

python、pandas、csv、matrix

我有一个由数百行组成的csv，每行都包含需要保持在一起的唯一值。它们的格式如下： WordTeams (column name) 1 cat, dog, frisbee, person, rat 2 mouse, cheese, saw, mat, moose 我正在尝试使用pandas将它们转换成一个列表，如下所示： [cat, dog, frisbee, person, rat] [mouse, cheese, saw, mat, moose] 我是pandas的新手，不知道如何在列表中添加单独的行。最后，我希望将这些列表转换为比较它们自身的矩阵，如下所示。我打算通过将每个单元格值

浏览 2提问于2017-10-26得票数 0

1回答

对Pandas时间序列按分钟分组的事件进行计数

python、datetime、numpy、matplotlib

嗨，我有一个时间序列，我想计算一下数据帧中每分钟有多少个事件。然后，我想将所有日期组合在一起，并打印包含事件的日期时间。最后，我想使用bokeh和matplotlib输出折线图和直方图。 import numpy as np import pandas as pd from pandas import Series, DataFrame import matplotlib.pyplot as plt #alows you to see matplotlib in Inotepad %matplotlib inline dframe = pd.read_table('info.txt&#

浏览 0提问于2016-01-08得票数 0

1回答

一种更快的计算标记链接数量的方法

python、regex、pandas

我有一个包含reddit注释的dataframe df。每个评论可能包含许多标记链接。例如, '[a](https://www.google.com/) bcd [e](https://pandas.pydata.org/)' 我想数数这些联系。我的方法是df['comment'].str.count('\[(?P<txt>[^\]]+)\]\((?P<lnk>[^\)]+)\)')。因为我的dataframe包含超过400万行，所以我想问一问是否有更快的方法来做到这一点。非常感谢! import pandas as p

浏览 2提问于2021-04-07得票数 0

回答已采纳

1回答

使用熊猫和蟒蛇获取“不能将字符串转换为浮动”的错误？

python、pandas

如何将字符串转换为浮动？下面是我的代码，我尝试使用dtype和astype方法： for f in files: data = pd.read_csv(os.path.join(path, f), sep=";", dtype={"Unnamed: 5":float}) data=data.drop(data.index[:4]) df = df.append(data) for x in df: print(x) if x == "Unnamed: 0": feeName = df[

浏览 5提问于2021-07-16得票数 0

回答已采纳

1回答

根据一列中定义的字符串列表过滤pandas数据帧

python、pandas

我需要根据可能出现在其中一列(在其他字符串中)的字符串列表来过滤cars pandas数据帧。所以我有这样的国家/地区列表： filterLocation = ['Germany','Austria','Slovenia'] 我想过滤掉pandas dataframe的Location列中包含这些单词的所有行。我有这个： carsresult = cars.loc[~cars['adCarLocation'].isin(filterLocation)] 但由于某种原因，这不起作用..

浏览 3提问于2020-02-25得票数 0

1回答

在有序列表中合并数据

python、pandas、concatenation

我有一个数据字典(opdict)，根据它的键值进行排序。这给了我一个元组列表(oplist)，其中的元组包含两个元素:索引0包含opdict的键值，索引1包含opdict的值(dataframes)。我的问题是，如何将oplist中的所有数据行合并为一个单独的dataframe (opdf)，即首先将所有数据的第一行叠加到oplist中，然后将所有数据的第二行叠加到oplist中，等等。我有一种感觉，pandas.concat或pandas.join是要走的路，但我不确定正确的代码。谢谢你的帮忙!

浏览 5提问于2020-02-15得票数 1

回答已采纳

1回答

循环遍历dataframe以提取匹配字典的子字符串

python、loops、pandas、dataframe、substring

我试图在dataframe中循环一列，如果它包含字典中的值，则使用环列中的子字符串创建一个新列。更具体地说，如果地址列中的单个行在州名和缩写字典中包含状态，则将状态缩写附加到将成为新列的列表中。下面的代码适用于完全匹配，但不扫描行以查找子字符串： import pandas as pd df = pd.DataFrame((['Austin, Texas', 'Texas', 'Seattle, Washington', ',,, Texas&#

浏览 0提问于2016-05-03得票数 1

回答已采纳

2回答

熊猫-删除只有NaN值的行

python、pandas、dataframe、rows、nan

我有一个包含许多DataFrame值的NaN。我想删除包含太多NaN值的行；具体来说:7或更多. 我尝试过几种方法使用NaN函数，但很明显，它贪婪地删除了包含任何值的列或行。这个问题()告诉我，如果我只需要编译一个包含太多NaN值的行的列表，我就可以用一个简单的 df.drop(rows) 我知道我可以使用count函数来计数非空值，它可以从总数中减去并得到NaN计数(是否有一种直接的方法来计算一行中的NaN值)。但即使如此，我也不知道如何编写一个遍历DataFrame的逐行循环。下面是一些我认为是正确的伪代码： ### LOOP FOR ADDRESSING EACH row:

浏览 4提问于2014-08-05得票数 14

回答已采纳

1回答

如何检查时间戳列表中的元素是否在包含时间戳的系列中？

python、pandas

问题：我想检查pandas.Timestamps列表中的哪些条目在pandas.Timestamp系列的数据中。问题是，当我使用in运算符来检查列表中的值是否在序列中时，会返回一个空列表，即使该系列中有一个特定的值。代码：一张时间戳清单： dates_range = pd.date_range(start="2019-01-01", end="2019-01-31") type(dates_range[0]) # pandas._libs.tslibs.timestamps.Timestamp 包含时间戳的系列： type(_201

浏览 1提问于2020-09-30得票数 1

回答已采纳

1回答

Python :如何在Pandas中运行Axis参数？

python、pandas、axis

背景在熊猫中，如果我使用以下方法： df.sum(axis=1) 它返回每一行的和。以同样的方式，我期望以下内容删除任何包含缺失值的行： df.dropna(how='any', axis=1) 但是上面的代码行实际上删除了任何包含缺失值的列，而不是删除缺少值的行。的问题是：我理解为什么第一行返回行的和；但是(axis=1)怎么会删除列呢？ =========为了澄清这个问题，我提供了以下示例： import numpy as np import pandas as pd np.random.seed(100) df = pd.DataFrame(np.random.ra

浏览 4提问于2022-07-06得票数 0

6回答

如何基于条件表达式从pandas DataFrame中删除行

python、pandas

我有一个pandas DataFrame，我想从其中删除特定列中字符串长度大于2的行。我希望能够做到这一点(根据)： df[(len(df['column name']) < 2)] 但我只是得到了一个错误： KeyError: u'no item named False' 我做错了什么？ (注意:我知道可以使用df.dropna()去掉包含任何NaN的行，但是我不知道如何删除基于条件表达式的行。)

浏览 3提问于2012-12-13得票数 470

回答已采纳

3回答

如何在不使用VBA的情况下为excel中的数据列表筛选列？

excel

我有一个14000行9列的excel表格，第一列是姓名，第二列是电话号码等…我有一个包含100个电话号码的列表，希望将其过滤掉，但到目前为止，我只能过滤该列表中的一个值并得到一行结果。但是我想要得到我的列表中包含电话号码的所有行。如何筛选多个值？

浏览 0提问于2020-06-13得票数 0

3回答

星星之火--如何有效地从所有所选列都包含空的数据中删除行？

scala、apache-spark

我有一些包含许多列和列名列表的dataframe。如何从列表中删除nulls列中包含all列中的这些行？

浏览 11提问于2021-01-30得票数 0

回答已采纳

1回答

包含列表列( DataFrame )的Pandas DataFrame中的行副本(Python3)

python、python-3.x、pandas、dataframe

假设我有这个Pandas df A B 0 100 [2, 18, 20] 1 200 [3, 17] 2 200 [3, 17] ... 其中，列A为整数类型，列B为整数类型列表。假设我想数一下有多少重复的行。在这个3行的小例子中，有一个重复行。因此，df.duplicated().sum()应该为这个小示例输出1。但是，每当我执行命令时，它就会抛出一个错误： TypeError: unhashable type: 'list' 我如何理解为什么会发生这种情况，是因为行中的每个值都成为了隐藏字典中的一个键，并且一个值将

浏览 8提问于2022-08-15得票数 2

2回答

如何从候选列表中识别包含最少不同单词的行？

python、regex、dataframe

我有一个单词列表和一个数据集。我想识别数据集中中至少有两个单词的行。我能够识别至少包含两个列表单词的行，但我的代码也有问题地标识了重复单个列表单词的行。这是我的密码： import pandas as pd data={'Name':['Redred','redblue','redgreen','blue']} df=pd.DataFrame(data) df['Good colours'] = (df['Name'].str.contains("(red.

浏览 14提问于2022-01-02得票数 -2

回答已采纳

1回答

如何在pandas python中获取基于一个值的多个列名？

python、pandas、dataframe

我有一个包含规格化值的数据帧。我可以从每一行获得最大值，但现在我还想获得相应的列名。例如df： |----------------------------------------| | a | b | c | 'newcol' | |----------------------------------------| | 0.960 | 1.00 | 1.00 | b, c | |----------------------------------------| | 0.922 | 0.955 | 0.9

浏览 26提问于2020-10-22得票数 2

回答已采纳

2回答

只包含矩阵列表中完整案例的子集行

arrays、r、list、matrix、na

我有一个矩阵的列表，所有的等维数。列表中的每个矩阵表示不同的样本；每个矩阵包含X、Y和Z坐标的三列，每一行代表3D空间中的不同点(即一个可识别的地标)。大多数样本缺少特定地标的坐标数据(因此所有三列都包含NAs)。我想对列表中的所有矩阵进行子集，以便它们只包括包含完整数据的标记/行(也就是说，对于整个列表中的任何样本/矩阵，该行中不存在NAs )。我担心对于以列表格式存储的数据来说，这可能是一项相当复杂的任务。由于所有矩阵都有相同的维数，那么将数据转换为数组是否更容易呢？我希望避免这样做，因为它会(我相信)删除用于标识数据的行、列和列表元素的名称。

浏览 1提问于2013-12-16得票数 2

回答已采纳

1回答

Pandas -将数据追加到特定列

python、pandas

我需要将列表中的数据附加到特定的列。我有4个列表： orderNumber = ['123456789'] countryOfOrigin = ['United Kingdom'] sizeList = ['2', '4'] quantityList = ['10', '12'] 我还有一个CSV文件，包含以下标头： OrderNumber COO Size QTY 我需要这些列表附加到此CSV在其正确的列。如果列表在数据中只有一项，则简单地对其进行复制以填充所有行 OrderNumb

浏览 28提问于2019-10-17得票数 1

回答已采纳

2回答

如何在python中将整个列表写入数据结构

python、class、pandas、data-structures

因此，我面临的问题是，我想创建一个数据结构，其中包含来自我的熊猫数据帧的46个项目。因此，我有了完整的列名列表和pandas dataframe。所以有没有办法把每一行pandas都转换成我的数据结构的一个对象。所以说：我有一个很棒的地方列X Y A 1 2 B3 4 C5 6 所以我想把每一行都转换成一个对象考虑到我有46列和100,000行，有什么好方法可以做到这一点吗？

浏览 1提问于2015-10-31得票数 0

1回答

熊猫先进的read_excel或ExcelFile.parse

python、pandas、import-from-excel

我正在尝试将excel文件有条件地解析到Pandas数据文件中。我有一组excel文件，每个文件的顶部都有一些不属于数据的行--一些基于报表参数创建报表的标识数据。我想在ExcelFile.parse()中使用skiprows=some_number方法，但是我不知道每个文件的some_number是什么。我知道HeaderRow将从一个可能性列表中的一个成员开始。我如何告诉Pandas从行开始创建dataframe，该行在我的可能性列表中包含任何some_string？或者，是否有一种方法可以导入整个工作表，然后删除行前面的行，其中包括我的可能性列表中的任何some_string？

浏览 3提问于2015-04-13得票数 1

回答已采纳

2回答

改变散点点颜色w.r.t特征

python、pandas、matplotlib

我有一个熊猫Dataframe，它有3个特性(列)，即X、Y和Z。X和Y是包含数据的列表，而Z包含字符串值的列表(颜色为-Red & Blue)。我想要一个散点图，x轴作为特征X，y轴有特征Y，散点点根据Z中的值着色。为了前夫。如果一行的Z值为红色，则将点涂成红色，蓝色表示为蓝色。 data_frame['X'] = pandas.Series(X) data_frame['Y'] = pandas.Series(Y) data_frame['Z'] = pandas.Series(Z) data_frame.plot(kind=&#

浏览 6提问于2016-04-13得票数 0

回答已采纳