使用列和行作为参数遍历整个Pandas Dataframe_使用“DataFrame”参数创建包含多个列的pandas数据，并将列表作为输入_Pandas DataFrame:以索引值和列值作为参数，按单元格应用函数 - 腾讯云开发者社区

python、pandas

Python 2.7，Pandas 0.18。我有一个DataFrame，还有一些方法可以通过一个条件参数来选择行的子集。我想知道一种更惯用的方法来编写与所有行匹配的条件。下面是一个非常简单的例子： import pandas as pd def apply_to_matching(df,criterion): df.loc[criterion,'A'] = df[criterion]['A']*df[criterion]['B'] df = pd.DataFrame({'A':[1,2,3,4],'B

浏览 3提问于2016-10-27得票数 1

回答已采纳

4回答

在Python中循环遍历数据帧的更优雅的方法

python、pandas

对于一个可迭代的对象，我们可以使用 for item in items: 但是，如果我有两个并排的可迭代程序，比如有两列的pandas数据帧，会怎么样呢？我可以使用上面的方法遍历一列，但是有没有一种更优雅的方法同时遍历两列呢？ import pandas as pd df = pd.DataFrame({'col 1': [1,2,3,4,5], 'col 2': [6,7,8,9,10]}) i = 0 for j in df['col 1']: print(j) print(df['col 2'][i])

浏览 15提问于2019-02-15得票数 1

1回答

Pandas对整个数据集进行单行过滤-它是如何实现的？

python、pandas、dataframe

我现在正在研究这个奇妙的库，我对过滤，甚至列操作是如何完成的感到非常困惑，并试图理解这是pandas还是python本身的一个特性。更准确地说： import pandas df = pandas.read_csv('data.csv') # Doing df['Column'] # would display all values from Column for dataframe # Even moreso, doing df.loc[df['Column'] > 10] # would display all values fr

浏览 12提问于2020-07-01得票数 1

回答已采纳

1回答

在Pandas数据帧上使用apply()时出现Numpy解包错误

python、pandas、numpy

我有一个Pandas DataFrame，它有两列，其中包含范围[-pi，pi)中的一些角度。我需要计算每一行的瞬时角速度，这可以使用diff()来完成，但是当我的数据跨越从pi到-pi的不连续时，这种简单的方法就失败了，例如我正在尝试对我的列使用numpy.unwrap()，但是当我尝试下面的代码时，我得到了一个ValueError。 angle_data["theta"].apply(np.unwrap) <Traceback message> ValueError: diff requires input that is at least one dim

浏览 74提问于2020-12-08得票数 1

回答已采纳

1回答

使用从拼花文件创建的dataframe时内存使用量过高

parquet、dask

我有拼花文件，也就是800 K行x8.7K列。我把它装进了一个dask数据仓库： import dask.dataframe as dd dask_train_df = dd.read_parquet('train.parquet') dask_train_df.info() 这产生了： <class 'dask.dataframe.core.DataFrame'> Columns: 8712 entries, 0 to 8711 dtypes: int8(8712) 当我尝试执行像dask_train_df.head()或dask_train_df

浏览 0提问于2018-12-24得票数 6

回答已采纳

2回答

如何使用列数据源获取行的索引？

python、pandas、bokeh

我使用从CSV文件中填充的熊猫数据帧，然后使用Bokeh将该数据帧转换为ColumnDataSource。看上去像是： dataFrame = pandas.read_csv('somefile.CSV') source = ColumnDataSource(dataFrame) 现在我有了所有的列，我想做基于行的计算。例如:我有三列： x, y, colour 它可能有以下内容： 1, 2, blue 2, 5, red 1, 8, yellow 现在，当我在源代码中搜索时，我想在该行中更改一些关联变量，那么我如何做到这一点： # how do i step throug

浏览 1提问于2017-10-10得票数 0

回答已采纳

2回答

如何在多把钥匙上使用熊猫石斑鱼？

datetime、pandas-groupby

我需要通过datetime列和另一个str(object)列来转换一个dataframe，以便按组应用函数，并将结果分配给组的每个行成员。我理解，但不能同时为这两个条件创建一个pandas.Grouper。因此：如何在多列上使用pandas.Grouper？

浏览 6提问于2018-09-05得票数 16

回答已采纳

1回答

将在Python中创建的pandas数据帧插入到SQL Server中

sql-server、python-3.x、pandas、pyodbc

如上所述，我在Python中创建了一个数据集合(40k行，5列)，希望将其插入回SQL Server表中。通常，在SQL中，我会调用'select * into myTable from dataTable'来执行插入操作，但是驻留在pandas dataframe中的数据显然会使这一过程复杂化。我并不正式反对使用SQLAlchemy (尽管我希望避免再次下载和安装)，但我更喜欢在Python中进行本机操作，并且我使用pyodbc连接到SSMS。有没有一种简单的方法来避免循环(即逐行插入)？

浏览 2提问于2018-11-07得票数 6

2回答

将csv读入pandas数据帧，但避免NaN行

python-3.x、pandas、csv

我有一个csv文件，其中有73行数据和16列，我想读取它并将其传递给pandas数据帧，但当我这样做时 data_dataframe = pd.read_csv(csv_file, sep = ',') 我得到了3152行和22列，73行和16列的数据，其余的只有纯NaN值。如何告诉pandas读取有效的行和列数据，并避免所有这些额外的NaN数据？

浏览 43提问于2021-11-16得票数 0

回答已采纳

1回答

如何将Sklearn SVM实现应用于使用SPARK ML计算的特征( Spark ML中缺少多类SVM )

pandas、apache-spark、dataframe、scikit-learn、pyspark

我有220 GB的数据。我已经将其作为两列读取到spark dataframe中: JournalID和Text。现在，我的数据帧中缺少27行。使用NGram类，我在dataframe中添加了另外两个列Unigram和Bigram，其中包含文本列中的单字和双字。然后，我使用一元和二元语法列上的pyspark的TF和IDF类计算TFIDF，并将其作为另一列添加到dataframe中。现在我为dataframe中的每一行都有了journalID和TFIDF vector。我想将支持向量机应用于所有类型的核，以TFIDF向量作为特征，以JournalID作为标签。由于多类支持向量机不存在于pys

浏览 1提问于2018-12-17得票数 0

2回答

熊猫:检查双星旗图案时的错误

python、pandas、series、binary-operators

我有一个dataframe，其中int类型的一个列正在存储二进制标志模式： import pandas as pd df = pd.DataFrame({'flag': [1, 2, 4, 5, 7, 3, 9, 11]}) 我尝试以通常的方式(使用二进制和运算符)选择具有值匹配4的行： df[df['flag'] & 4] 但失败的原因是： KeyError：“列中没有[Int64Index(0，0，4，4，4，0，0，0，dtype=‘in 64’)]” 如何实际选择与二进制模式匹配的行？

浏览 6提问于2021-06-19得票数 0

回答已采纳

1回答

在DataFrame中更改列

python、pandas

我希望在数据帧的列中更改字符串的一部分。但是，我无法让它在数据帧中进行更新。这是我的密码。 import pandas as pd #File path csv = '/home/test.csv' #Read csv to pandas df = pd.read_csv(nuclei_annotations_csv, header=None, names=['A', 'B', 'C', 'D', 'E', 'F']) #Select Data to update paths

浏览 0提问于2018-09-28得票数 0

回答已采纳

1回答

在DataFrame创建中使用以前的列创建新列

python、pandas、dataframe

我知道如何基于Pandas中的另一个列创建一个新列。我要做的是在创建DataFrame时基于另一个列创建一个新列。下面是我现在拥有的代码： rng = np.random.default_rng() number_of_trials = float('10E+06') simulations = pd.DataFrame({'true_average': rng.beta(81, 219, size=int(number_of_trials))}) simulations = simulations.assign(hits=lambda x: rng.bino

浏览 38提问于2021-03-29得票数 0

回答已采纳

1回答

DataFrame中词频的计算

python、pandas、indexing、dataframe、term-document-matrix

我正在尝试创建一个dataframe，其中第一列( "Value“)在每一行中都有一个多字字符串，而所有其他列都有来自”Value“中所有字符串的唯一单词的标签。我想用每个字符串(一行)的单词频率填充这个数据，检查所有唯一的单词(列)。在某种意义上，创建一个简单的TDM。 rows = ['you want peace', 'we went home', 'our home is nice', 'we want peace at home'] col_list = [word.lower().split("

浏览 1提问于2015-10-23得票数 1

回答已采纳

1回答

如何加快在数据框列中查找重复项的速度

python、pandas、numpy

我希望找到在dataframe列中出现重复值序列的索引。我希望结果是一个列表列表，其中每个子列表都是重复值索引的单个序列。我当前的代码可以工作，但相当慢(10000行数据帧中10%重复的apx 15毫秒)： import pandas as pd import numpy as np import time # Given a dataframe and column, return a list of lists where each sublist # contains indexes of the sequential duplicates def duplicate_ranges(

浏览 0提问于2017-03-03得票数 0

1回答

在dataframe上进行Dask计算以添加列返回AttributeError

python、json、pandas、dask、dask-dataframe

我有一个函数，它使用函数将列添加到DataFrame中，例如 def myfunc(x): resp_data = {'status': '1', 'data': x} return json.dumps(resp_data) 最初的Pandas dataframe df被转换为Dask DataFrame，如下所示 import dask.dataframe as dd ddf = dd.from_pandas(df, npartitions=30) 现在，我调用函数myfunc on ddf，使用现有的

浏览 2提问于2022-01-27得票数 1

回答已采纳

1回答

，尝试更新单元格值

python-3.x、pandas、dataframe

我有两个dataframe，都有一个列日期：我需要在first dataframe中设置第二dataframe中特定列的值，因此，首先，我用以下方法找到了正确的第一行数据： id_row = int(dataset.loc[dataset["time"] == str(searchs.index[x])].index[0]) #example: 910 然后，我想更新此行中列['search_volume']的值：910 我要这样做： dataset['search_volume'][id_row] = searchs[kw_list[0]]

浏览 1提问于2021-04-20得票数 0

1回答

熊猫to_numeric不是向下转换整数列

python-3.x、pandas

我有一个带有dtype('int64')列的dataframe。列中的值从0到10不等。dataframe有770 K行和56列的不同类型。当我运行下面的代码时，我得到了dtype('int64')。我本以为结果至少会降到int32或int16。下面是一个可复制的例子。 import pandas as pd df = pd.DataFrame([x for x in range(10)]*77000, columns=['recommendation']) df.dtypes df.recommendation.apply(lambda x:

浏览 0提问于2018-10-26得票数 7

回答已采纳

2回答

Pandas:如何使列行依赖于它以前的行，可能有一个函数？

python、function、pandas、rows

我试图根据A列和B列以前的数据计算B列，一个简单的函数例子是例如B(n) = A(n-1) + B(n-1)，其中n是Pandas数据帧的索引。我不需要使用dataframe索引。在本例中，我从B(1) =0开始，并以连续的方式添加A行。 n A(n) B(n) ---------------- 1 1 0 2 0 1 3 2 1 4 9 3 这种数据结构的一个示例将在Pandas中定义为 d = {'A' : pd.Series([1, 0, 2, 9],), 'B

浏览 2提问于2015-01-13得票数 1

回答已采纳

1回答

熊猫数据栏中单词的频率计数及在其他栏中的存储

python、pandas、text-processing

DataFrame 我有一个Pandas DataFrame的评论栏，如上图所示。我希望获取产品‘’review‘列中每一行中每个单词的计数，并将其存储到另一列，即products' word _ count’。我尝试的代码如下： products['word_count'] = products['review'].apply(lambda x : nltk.FreqDist) 但是，我得到的不是单词计数，而是列中的<class‘word .概率.’>对象！

浏览 1提问于2020-09-30得票数 0

1回答

如何在Pandas 0.21.0版本后将Python dict转换为DataFrame列？

python、pandas、dataframe

我试图在两台计算机上运行相同的脚本，并将我的字典结构、数据转换为Pandas DataFrame。 df = pd.DataFrame(data, columns=[column_label]) df.to_csv('./result.csv', mode='w', index=False) 它在Pandas版本低于0.21.0的计算机上工作得很好。但是，当我在服务器上执行相同的代码时，它会突然生成一个只包含列标签的csv文件，而没有任何数据。我尝试打印出df的值，但在服务器上完全是NAN。当我像这样删除列部分时： df = pd.DataFrame(dat

浏览 1提问于2018-01-15得票数 0

回答已采纳

1回答

按行名分组Pandas DataFrame

python、pandas、dataframe、row、pandas-groupby

我有一个简单的Pandas DataFrame，它有行名和2列，类似于下面的内容。 from pandas import DataFrame, Series row_names = ['row1', 'row2', 'row2', 'row4'] df = DataFrame({'col1': Series([1, 2, 3, 4], index=row_names), 'col2': Series([0, 1, 0, 1], index=row_names)}) 与

浏览 2提问于2014-04-03得票数 0

回答已采纳

1回答

将Pandas DataFrame传递给Scipy.optimize.curve_fit

python、pandas、scipy、mathematical-optimization、model-fitting

我想知道使用Scipy来适应Pandas DataFrame列的最佳方式。如果我有一个包含列(A，B，C，D和Z_real)的数据表(Pandas DataFrame)，其中Z依赖于A，B，C和D，我想要拟合每个系列行( DataFrame )的一个函数，该函数对Z (Z_pred)进行预测。要拟合的每个函数的签名是 func(series, param_1, param_2...) 其中，series是与DataFrame的每一行对应的Pandas Series。我使用Pandas Series，以便不同的函数可以使用不同的列组合。我尝试使用以下命令将DataFrame传递给scipy.

浏览 0提问于2016-02-06得票数 2

回答已采纳

1回答

Pandas:根据应用函数删除行

python、pandas

我有一个Pandas DataFrame，df，它有一个名为_text的列。我想删除对_text列中的值应用sentence_count不为0的所有行。我该怎么做呢？通常，对于Pandas，我会这样做： result_df = result_df[result_df['_text'] != ''] 但现在我不仅仅使用result_df['_text中的值，我还根据函数计算出的值进行过滤…… 有什么想法？谢谢!

浏览 11提问于2017-07-26得票数 8

1回答

将数据帧与元数据一起保存到CSV文件

python、pandas、csv、dataframe

我试图将我的数据写到具有多列的文本文件pandas dataframe中，但在文件中，我看到3列在行的末尾有"\“符号，在这行下面我看到下一列，我希望它与dataframe的1sts列在一行中。例如： Money Honey Boney \ 1. 34 34 464 2. ..... Yargen Newrte Ederblade 1. 34 45 545 2 ... 我的步骤： 1. wedew= open('file.csv','w') 2. wedew.write('\n' + str(df) + '\n')

浏览 1提问于2017-09-22得票数 0

3回答

如果列值为NaN，则返回布尔值。

pandas

我有多个列的Pandas DataFrame，我想检查特定的列值是否为NaN，如果是，我需要返回布尔值(真或假)。我试过了 pandas_df['col1'].isnull() 但是它返回所有带有索引和布尔值的行。

浏览 4提问于2019-05-21得票数 0

回答已采纳

1回答

是否附加条件熊猫数据？

python、pandas、numpy、dataframe

我是一个完整的python和pandas.I新手，我想遍历dataframe中的所有行，并检查"Class“列中的元素是否为1？如何做到这一点？另外，我想将这些特定的行附加到dataframe中吗？像这样 emptydataframe = pd.DataFrame(columns=['A','B','C','D','E','F','G']) data = pd.read_csv('data/trainData.csv')

浏览 1提问于2017-11-01得票数 0

回答已采纳

1回答

Python pandas数据帧事务

python、pandas、dataframe、transactions、sqlalchemy

请建议在一个事务中执行SQL语句和pandas dataframe .to_sql()的方法我有dataframe，并且想在插入之前删除数据库端的一些行因此，基本上我需要使用dataframe的.to_sql在一个事务中删除然后插入我将sqlalchemy引擎与pandas.df.to_sql()一起使用

浏览 0提问于2018-06-25得票数 1

2回答

Python，正则表达式.在熊猫数据框架中搜索点

python、regex、python-3.x、pandas

我有列'Country‘的pandas.dataFrame，head()在下面： 0 tmp 1 Environmental Indicators: Energy 2 tmp 3 Energy Supply and Renewable Electricity Produc... 4

浏览 2提问于2017-03-22得票数 0

回答已采纳

1回答

删除pandas数据帧上的索引和列

python、pandas

我有一份清单： import pandas as pd l = [[1,2,3],[4,5,6],[7,8,9]] New_dataframe = pd.DataFrame(l) print(New_dataframe) 输出： 0 1 2 0 1 2 3 1 4 5 6 2 7 8 9 我想删除那些索引的行和列。如何实现这一点？？DataFrame我希望看到的是： 1 2 3 4 5 6 7 8 9 如何删除索引列和行？？

浏览 0提问于2018-05-12得票数 4

回答已采纳

3回答

为什么我得到键错误，即使列存在于pandas中？

python、pandas、casting

我的文件包含Company，RecordID，Sale etc..When列。加载文件到pandas dataframe后，我首先尝试找到它的数据类型，它列出了一些列的浮点型/整型。所以我将它们改为字符串，如下所示； data = pd.read_csv(filepath) print(data.dtypes) Company Code object SiteCode int64 Product Name object RECORD ID int64 Tank ID

浏览 27提问于2019-10-16得票数 4

回答已采纳

6回答

如何在Pandas中获取数据帧中的行号和列号？

python、pandas

如何使用Pandas获取包含特定值的dataframe中的行数和列数？例如，我有以下数据帧： ? 例如，我需要知道"Smith“的行和列(行1，列LastName)。

浏览 125提问于2020-12-18得票数 0

2回答

如何将pandas.dataframe中的元素转换为np.float，同时使用pandas.read_csv读取csv文件？

python、pandas、csv、numpy

我有一个.csv文件，它是一个从软件导出的输出。这个.csv文件包含许多NaNs。我需要通过将数据读取到数据中来分析数据，并使用dataframe.fillna(0)将所有的NaNs替换为0。但是，当我使用pandas.read_csv()导入这个.csv文件时，dataframe中的元素类型是'str'，因此不能使用dataframe.fillna(0)。因此，我的问题是:如何在读取np.float文件时将元素转换为.csv？有一个关于dtype的论点是，下面是解释： dtype : Type name or dict of column -> type, defau

浏览 2提问于2017-08-23得票数 3

2回答

使用python类属性打印错误，我哪里出错了？

python、pandas、dataframe、class、attributes

我试图从电子表格中打印一个选择行和列，但是当我调用电子表格dataframe属性时，它无法打印未定义名称dataframe的状态。我哪里出错了？ import pandas class spreadsheet: def __init__(self, location, dataframe, column, rows): self.location = ('Readfrom.xlsx') self.dataframe = pandas.read_excel(location) self.column = 2

浏览 8提问于2021-03-25得票数 0

回答已采纳

1回答

如何使用style.applymap()对数据文件中的行进行着色？

python、pandas、dataframe、colors、rows

我想为DataFrame对象df中的“Grand Total”行和“Total”列着色，为此我尝试了以下操作： import pandas as pd # Function to set background highlight colour. def bg_colour (val): colour = '#ffff00' return 'background-color: %s' % colour df = pd.DataFrame({'Category': ['A','B','C&#

浏览 0提问于2020-08-11得票数 3

回答已采纳

3回答

为每个熊猫单元格设置相同的字典

python、python-3.x、pandas

我有一本简单的Python字典。我想在Pandas Dataframe中添加一个新列，其中该列中的每一行都等于字典。 import pandas as pd df = pd.DataFrame(data=[[1,2,3],[4,5,6]],columns=['A','B','C']) df['D'] = {'AA': 'BB', 'CC': 'DD'} 期望输出 A B C D 0 1 2 3 {

浏览 15提问于2019-06-19得票数 1

回答已采纳

1回答

在validate_operand中获取错误"a {obj}被传递“.format(obj=type(Obj))

python、pandas、merge

尝试将两个表- df和a_status合并为以下代码(使用熊猫)： df.merge('a_status', how='left', left_on='EMPLOYEE_NUMBER', right_on='employee_number') 表类型是<class 'pandas.core.frame.DataFrame'>数据类型，键列是对象(虽然实际的内容是int) 这就是我遇到的错误：行1993年，在validate_operand "a {obj}被传递“.format(obj=typ

浏览 4提问于2020-02-04得票数 0

2回答

将函数(MinCovDet)应用于Pandas数据帧滚动窗口(n x m数组)

python、pandas、scikit-learn、apply

我想使用sklearn.covariance MinCovDet计算滚动鲁棒协方差。我有一个有3000行和20列的dataframe df，其中包含索引中的日期。对于每一行，计算过去200天内的稳健协方差。我已经尝试过 df.apply(lambda x: MinCovDet().fit(df[x-400:x].values)) 我得到一个TypeError：(“无法转换输入[日期\n2004-01-02等... 有什么想法吗？更一般的问题是如何将函数应用于pandas Dataframe的n x m数组。非常感谢

浏览 1提问于2018-07-05得票数 2

1回答

由其他数据行填充

python、pandas

我有个问题： import pandas df1=pandas.DataFrame([['2017-1-22',25,None],['2017-1-23','',''],['2017-1-24',24,15]],columns=['date','high_tem','low_tem']) df2=pandas.DataFrame([['2017-1-22',22,18],['2017-1-23',23,''],['

浏览 1提问于2017-01-22得票数 1

回答已采纳

1回答

read_csv读取值包含在另一个数据框的列中的行

python、pandas、dataframe

我正在处理大型数据帧(15 it )，每次我试图打开它们时，都会引发内存错误。我成功地打开了dataframe A，它的第一列也是dataframe B中包含的ID。现在，B有更多的行和ID，我并不关心，而且由于内存错误，我在打开它后无法过滤行，所以我试图在打开它时过滤需要的行。通过遵循这篇文章，skip specific line that contains certain value when you read pandas data frame我尝试使用： import StringIO import pandas as pd emptylist = [] def read_fi

浏览 1提问于2020-04-03得票数 0

3回答

根据实例类型删除pandas数据帧的行

python、pandas、datetime

基本上，我是在尝试删除pandas dataframe中的行，其中某一列中的值不是datetime的实例。我试过了： df = df[df[‘date’] == isinstance(datetime)] 我知道isinstance有两个参数(我遗漏了要检查的值)，但我不确定要放什么。

浏览 0提问于2018-06-01得票数 2

5回答

Pandas:从每行的随机列中选择值

python、pandas、dataframe、random

假设我有如下的Pandas DataFrame： df = pd.DataFrame({ 'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9] }) a b c 0 1 4 7 1 2 5 8 2 3 6 9 我希望生成一个新的pandas.Series，以便从DataFrame的随机列中逐行选择该序列的值。因此，可能的输出是序列： 0 7 1 2 2 9 dtype: int64 (在第0行中随机选择'

浏览 45提问于2019-07-25得票数 4

回答已采纳

2回答

有没有办法在pandas数据帧中添加一个列表？

python、pandas

我在pandas dataframe dfr中有一个列，其中有一个空列表。当我尝试追加它时，整个列都被更改了。下面是附加的代码。 N = 10 Nr = list(range(10)) dfr = pd.DataFrame(Nr,columns = ['ID']) dfr['Assignment'] = [[]] * dfr.shape[0] for i in range(N): dfr.loc[i][1].append(i) dfr 现在，当我运行这段代码时，整个赋值列都会发生变化。有人能帮我一下吗。我只需要在每一行的列表中有一个i的值。

浏览 1提问于2020-02-21得票数 3

1回答

函数将迭代目标读取为局部参数字符串，而不是for循环中的迭代值

python-3.x、pandas、for-loop、crosstab

尝试使用pandas交叉表函数运行这个简单的for循环。迭代目标是交叉表函数中的参数。它应该读取列的列表，并为每个列组合生成一个交叉表。但是相反，它将我的'i‘可迭代解释为列的文字标题，而不是它在迭代中应该是什么变量。我得到的错误是：'DataFrame‘对象没有'i’属性，因为它将'i‘读取为属性的文字名称，而不是从循环中读取应该存储在i中的值。 import pandas DF = pandas.read_excel('example.xlsx') Categories = list(DF.columns.values) for

浏览 1提问于2019-04-18得票数 1

1回答

将Numpy数组转换为Pandas DataFrame

python、python-3.x、pandas、numpy、concatenation

我有一个Pandas (dataset，889x4)和一个Numpy ndarray (targets_one_hot，889X29)，我想连接它们。因此，我想将targets_one_hot转换为Pandas。为了做到这一点，我看起来像。但是，这些建议都是关于较小的数组的，对于这些数组，写出不同的列是可以的。对于29列，这似乎是低效的。谁能告诉我将这个Numpy数组转换为Pandas DataFrame的有效方法？

浏览 2提问于2019-10-13得票数 1

回答已采纳

1回答

如何将多个带有欧洲数字(逗号作为小数分隔符)的列转换为浮点型？

pandas、floating-point、numbers、digit-separator

我有多个列包含欧洲格式的数字，例如 1.630,78 它们在前面或结尾有不同的字符(欧元，%)，所以我不能使用pandas转换函数。 pd.read_csv("file.csv", decimal=',', separator={"col1": float, "col": float} 不会起作用，因为我必须首先删除符号，这是我只能在读取整个文件后才能做的。 Search and replace dots and commas in pandas dataframe 不起作用，我会得到一个 ValueError: could n

浏览 35提问于2020-06-25得票数 0

回答已采纳

3回答

熊猫DataFrame滤波准则

python、regex、pandas、filter

我不明白pandas DataFrame filter。设置 import pandas as pd df = pd.DataFrame( [ ['Hello', 'World'], ['Just', 'Wanted'], ['To', 'Say'], ['I\'m', 'Tired'] ] ) 问题 df.filter([0], regex=r'(Hel|Just)&

浏览 6提问于2016-05-06得票数 13

回答已采纳

3回答

即使存在匹配值，Python也会返回空的dataframe

python、pandas、csv、encoding

我尝试在.csv中查找值与“2.borgere> 65”匹配的行。在我的.csv中有5行第一列与单词匹配，但是pandas返回一个空的DataFarme。我尝试加载ISO8859-1和拉丁文-1格式的.csv，但结果相同。下面是我的代码： #LOAD NØGLETAL IN PANDAS df_noegletal = pd.read_csv("zipfiler/Vaccine_maalgrupper_DB/Noegletal_vacc_daekning.csv", encoding="Latin-1") #PRINT ROWS MATCHING VA

浏览 5提问于2021-06-30得票数 0

4回答

熊猫:从DatetimeIndex中提取值

python、pandas、datetimeindex

我有一个Pandas DataFrame，它的行和列是DatetimeIndex。 import pandas as pd data = pd.DataFrame( { "PERIOD_END_DATE": pd.date_range(start="2018-01", end="2018-04", freq="M"), "first": list("abc"), "second": list("efg")

浏览 23提问于2022-11-01得票数 1

回答已采纳

1回答

如何创建新的pandas列，该列是索引范围中不包括行值的每个值的列表

python、pandas、list、dataframe、indexing

我想知道是否可以在pandas dataframe中创建一个新列，它是每个值的列表，不包括行本身的值。例如，在下面的df中，对于列'list‘中的第一行，值b，c，以及行本身的值'a’。是否可以对每个索引执行此操作？我已经尝试过了，但它返回了每个索引组合的所有值的列表： import pandas as pd d = {'index': [1, 1, 1, 2, 2, 3], 'col1': ['a', 'b', 'c', 'd', 'e, f', 'g&

浏览 13提问于2020-05-29得票数 0

回答已采纳