获取每个类pandas数据帧的百分比_Pandas:如何获取目录中每个文件行数的数据帧？_在列表中分别获取每个pandas数据帧列名 - 腾讯云开发者社区

、、

我想在Pandas中将一个数据帧除以另一个数据帧，以最终表示百分比变化。两个数据帧值都包含NaN和0。现在，当我将一个数据帧除以另一个数据帧时，两个数据帧的值都为零的结果是NaN。我知道为什么0/0设置为np.nan，但从百分比变化的角度来看，我需要0/0为0。实现这一目标的最干净的方法是什么？重现问题： import pandas as pd import numpy as np data_with_zeros = pd.DataFrame({'a': [2, np.nan, 0, 3], 'b': [np.nan, 2, 0, 6]}) data_

浏览 108提问于2016-12-29得票数 3

回答已采纳

2回答

pyspark数据帧中所有列的总计数为零

、、

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

2回答

不带group by的列的累积百分比

、

我有以下数据帧： import pandas as pd data = [['2020-08', 'Peter', 0.5], ['2020-08', 'Tom', 0.29], ['2020-08', 'Kurt', 0], ['2020-09', 'Peter', 0], ['2020-09', 'Tim', 0.79], ['2020-09', 'Kurt', 0]] df1 = pd.Da

浏览 24提问于2020-10-22得票数 0

1回答

计算经常性客户

、、

我正在分析一家商店的销售数据，我想计算在接下来的一个月里成为常客的“第一批顾客”的百分比。我有一个包含所有订单的DataFrame。这包括客户id、日期和标志(如果这是他/她的第一个订单)。这是我的数据： import pandas as pd data = {'Name': ['Tom', 'nick', 'krish', 'Tom'], 'First_order': [1, 1, 1, 0], 'Date' :['01-01-2

浏览 15提问于2019-09-06得票数 4

回答已采纳

1回答

在pandas中重塑表格

、、、

下面是我在合并多个查询日志数据帧时创建的数据帧的摘录： keyword hits date average time 1 the cat sat on 10 10-Jan 10 2 who is the sea 5 10-Jan 1.2 3 under the earth 30 1-Dec

浏览 0提问于2013-05-23得票数 0

回答已采纳

2回答

根据列值保持数据帧的行数百分比

、

假设我有一个这样的数据帧： import pandas as pd df = pd.DataFrame({'id':['A','A', 'A', 'B','B'], 'value':[2, 4, 6, 3, 4]}) 我只想对id=A进行过滤，并保留x百分比的id=A的行。例如，如果为x=60%，则数据帧应如下所示： col1 col2 0 A 2 1 A 4 2 B 3 2 B 4 如何在pandas中高效地执行此操作

浏览 2提问于2020-03-13得票数 2

2回答

在pandas中如何将一列的行乘以groupby？

、

我有一个pandas数据帧，格式如下： user percent x 0.2 x 0.5 x 0.8 y 0.1 y 0.6 y 0.2 y 0.6 我正在尝试将每个用户的行中的百分比相乘。在本例中，x的结果将为0.2*0.5*0.8 = 0.08 因此，数据帧应如下所示： user result x 0.08 y 0.0072 如何获得我的预期输出？

浏览 4提问于2018-01-24得票数 6

回答已采纳

1回答

从存储在列表中的数据帧中提取列。列表由多个数据帧组成。

、、、、

我有一个名为数据的列表，它由多个数据组成。数据、data1等将显示数据帧1、数据帧2等。所有的数据帧在no.of行和no.of属性方面都是不同的。我想知道是否有一种方法可以编写data1来提取数据格式2和列3的名称。也就是说，datai在(i+1)th数据帧中表示(j+1)th数据帧和(j+1)th属性。 list(data1.columns.values)我理解上面的代码为我提供了所有的属性。我很想知道使用上面提到的方法- datai的索引。 import os import pandas as pd path = os.getcwd() files = os.listdir(path) f

浏览 0提问于2019-06-04得票数 0

回答已采纳

1回答

如何在所有的dataframe python中将两个数字之间的'，‘替换为X.X%

、

我在pandas data frame中有一个专栏，如下所示。列名为'ingredients_text‘ ? 现在，我希望在所有数据帧中替换此列中的所有值，如5.5%到5.5%。

浏览 9提问于2021-04-08得票数 0

回答已采纳

2回答

如何在分组条形图上显示百分比

、、、、

以下是pandas数据帧和由其生成的条形图： colors_list = ['#5cb85c','#5bc0de','#d9534f'] result.plot(kind='bar',figsize=(15,4),width = 0.8,color = colors_list,edgecolor=None) plt.legend(labels=result.columns,fontsize= 14) plt.title("Percentage of Respondents' Interest in Data Sci

浏览 0提问于2018-08-29得票数 15

回答已采纳

2回答

如何忽略列长度检查中的NaN

、、

我正在尝试计算数据帧中每一列的最大和最小长度，该数据帧中有一些缺失值。Pandas将这些缺失值视为"NaN“，并将长度计为3。如何在计算最大和最小长度时完全忽略缺失值？下面是我的代码： import pandas as pd columnname=[] maxColumnLenghts = [] minColumnLenghts=[] for colname in df.columns: columnname.append(colname) for col in range(len(df.columns))

浏览 51提问于2020-11-06得票数 1

回答已采纳

1回答

对pandas中的单列进行固定百分比的混洗

、、、、

我正在尝试将pandas中的单列以固定的百分比进行混洗。总迭代次数= 30)在每次迭代中使用Sklearn utils shuffle函数。但它不会改变原始数据帧。有没有办法将此操作应用于原始数据帧？或者还有其他方法吗？谢谢。代码如下： from sklearn.utils import shuffle for i in range(0, 30, 2): percent = (i/100) * len(df_task2_train) shuffle(df_task2_train['class'], n_samples=int(percent))

浏览 23提问于2020-11-10得票数 0

1回答

将列中的值拆分为多个列

、

我有一个pandas数据帧，我希望将列C的数字相加在一起，并创建一个新列D。例如 ? ? 提前谢谢。

浏览 10提问于2021-01-05得票数 0

3回答

如何仅计算连续天数的百分比变化？

、

这是一个熊猫数据帧。我想要计算值的变化百分比。我的数据有一些差距，所以我想只根据连续的几天来计算百分比变化。原始数据： date value 0 2020-08-05 123.45 # (Wednesday) 1 2020-08-06 678.90 # (Thursday) 2 2020-08-07 234.56 # (Friday) 3 2020-08-10 789.01 # (Monday) 4 2020-08-11 345.67 # (Tuesday)

浏览 1提问于2020-08-21得票数 0

1回答

如何在Python中找到某一列数据帧中某物的百分比？

、、、

我有以下数据帧 import pandas as pd df = pd.DataFrame({'Volcano Name': ['a', 'b', 'a', 'c', 'b', 'b', 'e', 'd', 'b', 'e', 'e'], 'Start Year': [1960, 1962, 1961, 1961, 1961, 1960, 1959

浏览 22提问于2020-12-13得票数 1

3回答

pandas:将数据帧拆分为多个csvs

、

我有一个大文件，导入到Pandas中的单个数据帧中。我使用pandas根据数据帧中的行数将文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9 有没有一种方法可以做到这一点，而不必创建更多的数据帧？

浏览 0提问于2017-11-22得票数 2

1回答

pandas数据帧中一列热编码列的统计

、、

我有一个Pandas dataframe，它有一个标题为"label"..。它有三个标题为featureA_1, featureA_2, featureA_3分别。这些列表示表示一个热编码值的列featureA(它可以有三个唯一的值。)同样，它也有两个标题为featureB_1和featureB_2分别。这些列表示featureB(它可以有两个不同的值。) 以下是上述数据帧的示例 ? ..。可以使用以下命令生成上述数据帧： import pandas as pd dictt = { "label": ["cat", "

浏览 27提问于2021-02-19得票数 5

回答已采纳

1回答

Pandas Groupby没有对单个结果进行聚合

、、、

我在Pandas有一个数据帧，它显示了一个城市/州的男性所占的百分比。数据帧df如下所示(请注意，这不是我的实际使用情况/数据，但我的数据类型类似) STATE CITY PERC_MEN ALABAMA ABBEVILLE 41.3% ALABAMA ADAMSVILLE 53.5% .... WYOMING WRIGHT 46.6% 每个State/percentage of men组合将恰好返回一个值。如何显示给定州的城市/人口值？我的代码如下所示(我需要按STATE分组的第一行，因为我对数据做了其他事情) for state

浏览 4提问于2021-09-08得票数 0

1回答

存储在dataframe中的计算dask延迟对象

、、、

我正在寻找最好的方法来计算存储在数据帧中的许多dask delayed指令。我不确定是否应该将pandas数据帧转换为包含delayed对象的dask数据帧，或者是否应该对pandas数据帧的所有值调用compute调用。我非常感谢大家的建议，因为我在通过嵌套的for循环传递delayed对象的逻辑上遇到了问题。 import numpy as np import pandas as pd from scipy.stats import hypergeom from dask import delayed, compute steps = 5 sample = [int(x) for x

浏览 10提问于2019-08-10得票数 0

2回答

python追加到所有字典

、、、、

我在字典中使用字典。循环遍历pandas数据帧，操作行的值始终与字典中的一个键匹配，并基于该值将该行的其他值附加到该字典的列表中。但是，由于某些原因，这些值会被附加到其他字典的所有列表中 general_form = { "Percentage": np.nan, "DayPercentage": np.nan, "sample_size": np.nan, "Percentages": [], "DayPercentages": [] } #get all possible

浏览 0提问于2017-11-17得票数 0

3回答

计算多个pandas数据帧的百分比变化

、、

假设我有两个截然不同的pandas数据帧，它们具有完全相同的结构： df1 +---+---------+------+------+------+ | | summary | col1 | col2 | col3 | +---+---------+------+------+------+ | 0 | count | 10 | 10 | 10 | +---+---------+------+------+------+ | 1 | mean | 4 | 5 | 5 | +---+---------+------+------+------+ | 2

浏览 22提问于2019-08-12得票数 1

回答已采纳

1回答

使用相关矩阵中的目标变量列填充Python Pandas Dataframe

、、、、

我有一个由不同数据类型的45个变量组成的pandas数据框架，我正在使用'dython.nominal‘包来创建每个变量之间的关联矩阵。然后我想：答:子集我的数据帧(按地理位置过滤)，并在该子集上计算关联矩阵，然后 B:使用在步骤A中创建的数据帧中的目标变量的列，创建第二个pandas数据帧并添加到第二个pandas数据帧中。然后，得到的数据帧将是一个相关性矩阵，其中列索引是地理位置，行索引是其他44个变量。到目前为止，我拥有的代码是： import pandas as pd from dython.nominal import compute_associations t

浏览 0提问于2020-10-26得票数 2

1回答

计算时间序列占总时间序列的百分比

、

我正在查看县级采购数据(数百万账单)，并使用groupby使用matplotlib和pandas绘制时间序列 dataframe_slice.groupby(pd.Grouper(freq='1M')).bill_amount.sum().plot 其中bill_amount是一列浮点数，它显示了账单的金额。如何更改图表以将dataframe_slice显示为总数据帧bill_amount的百分比

浏览 13提问于2021-01-06得票数 0

1回答

将BioPython.Phylo距离矩阵转换为pandas数据帧

、、、

我想把一个Phylo.TreeConstruction.DistanceMatrix转换成一个pandas数据帧，但是不知道怎么做。有人知道是怎么回事吗？ alignment = AlignIO.read(align, "fasta") calculator = DistanceCalculator('identity', ) dismat = calculator.get_distance(alignment)

浏览 16提问于2021-05-20得票数 0

1回答

文件结构不一致的Pandas中的Read_csv

、、

在行尾不是标准的情况下，将csv文件读入pandas数据帧时遇到问题。下面是我的代码： df_feb = pd.read_csv(data_location, sep = ",",nrows = 500, header = None, skipinitialspace = True,encoding = 'utf-8') 以下是输出(略去个人信息)：这是输入数据的样子：上面的输出将本应为一行的内容拆分为4行。对于每个电话号码(电话号码=划线比特)，应该开始一个新的行。我的目标是让每行代码看起来像这样：提前感谢您的帮助！

浏览 1提问于2018-07-10得票数 1

1回答

将大于内存的SQL查询读入dask数据帧

、、

我需要将SQL表中的条目读取到dask数据帧中，以处理我需要读取的条目数量可能会超过内存中可以容纳的条目数量如何使用dask完成此操作？我正在做这件事 def get_frame_from_query(query, column_names): frames = [] batch = [] # TODO ask stackoverflow about this. for row in database_conn.FetchManyIter(query,batch_size=30000): #read from the database 30k rows at

浏览 13提问于2020-03-04得票数 1

回答已采纳

1回答

聚合上的数据帧复合计算

、、

import pandas as pd times = pd.to_datetime(pd.Series(['2014-07-4', '2014-07-15','2014-08-25','2014-08-25','2014-09-10','2014-09-15'])) strategypercentage = [0.01, 0.02, -0.03, 0.04,0.5,-0.3] df = pd.DataFrame({'Strategy': strategypercentage},

浏览 1提问于2018-02-11得票数 0

回答已采纳

1回答

如何逐个像素地比较两幅图像，并从图像的脏部分中帧出新图像

、、、、

我正在使用robot.screenCapture()和frame bufferedImage1捕捉屏幕。我又一次捕获了桌面屏幕和帧bufferedImage2。可以告诉我如何比较这两个图像(bufferedImage1和bufferedImage2)逐个像素。如果有任何不同，那么如何框架的部分是不同的？

浏览 3提问于2013-01-17得票数 1

回答已采纳

5回答

如何在pyspark中获取dataframe列的名称？

、

在熊猫中，这可以通过column.name来完成。但是，当它的spark数据帧列时如何做同样的事情呢？例如，调用程序有一个spark数据帧: spark_df >>> spark_df.columns ['admit', 'gre', 'gpa', 'rank'] 此程序调用我的函数: my_function(spark_df 'rank‘)在my_function中，我需要列的名称，即’rank‘ 如果是pandas数据帧，我们可以在my_function内部使用 >>> pand

浏览 1提问于2016-09-28得票数 55

1回答

如何从for循环中创建绘图

、、、

仅语法问题我读入了一个按日期对齐的大型数据帧。我有一个关注关键日期(时间窗口)的80+数据帧列表。我想循环遍历该列表并绘制每个项目(时间窗口)，x轴作为时间轴，y轴作为来自每个数据帧的特定数据列。所有数据帧都具有相同的格式和相同的列标题。然后，我希望我的for循环根据列表变量名保存每个绘图。但是，我不确定如何以正确的语法将这些参数传递给for循环。对于下面的问题，我假设温度是所有数据帧中的公共常量，并且是要为所有DF返回的Y轴。我能找到的最相关的例子(第21-24行)： In [21]: winter = daily['2012-12-01': '2013-0

浏览 0提问于2019-07-31得票数 0

1回答

动画函数未应用于每个元素

、、、

这是我在进度条中遇到的一个问题。我在我的"pro-bar“类中有数据百分比属性。每个数据百分比是不同的，但是当我在浏览器中获取第一个pro-bar的数据百分比值时，它将应用于所有下面是我的代码： $('.pro-bar').each(function( i, elem ){ var percent = $('.pro-bar').attr('data-percent'), barparcent = Math.round(percent*5.56), $elem = $(this);

浏览 0提问于2015-03-26得票数 0

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

3回答

在Python中过滤数据帧

、

我有一个包含2列的数据帧，如下所示： Index Year Country 0 2015 US 1 2015 US 2 2015 UK 3 2015 Indonesia 4 2015 US 5 2016 India 6 2016 India 7 2016 UK 我想创建一个新的数据帧，其中包含每年国家的最大计数。新的数据帧将包含3列，如下所示： Index Year Countr

浏览 0提问于2017-08-12得票数 2

1回答

基于pyspark的均值漂移聚类

、、、、

我们正在尝试将一个普通的python代码库迁移到pyspark。议程是对数据帧(以前是pandas，现在是spark)进行一些过滤，然后按user-ids对其进行分组，最后在顶部应用meanshift集群。我在分组数据上使用pandas_udf(df.schema, PandasUDFType.GROUPED_MAP)。但现在，最终输出的表示方式出现了问题。假设我们在输入数据帧中有两列：user-id和location。对于每个用户，我们需要获取所有集群(在location上)，只保留最大的一个，然后返回其属性，这是一个3维向量。让我们假设3元组的列是col-1、col-2和col-3。

浏览 11提问于2019-05-14得票数 0

回答已采纳

1回答

循环遍历熊猫数据帧列表，并将它们写入一个Excel文件中的不同选项卡中(来自Jupyter notebook)

、、、

我的Jupyter笔记本中有一个数据帧，我可以使用pandas ExcelWriter成功地将其写入到Excel文件中，但我宁愿将数据帧拆分为较小的数据帧(基于其索引)，然后循环它们，将每个数据帧写入到一个Excel文件中的不同工作表中。这似乎在语法上是正确的，但我的代码单元运行时根本没有结束： path = r'/root/notebooks/my_file.xlsx' writer = ExcelWriter(path) sheets = df.index.unique().tolist() for sheet in sheets: df.loc[sheet

浏览 16提问于2020-09-15得票数 0

回答已采纳

2回答

选择保持分发百分比的行？

我有一个现有的数据框架，其变量“等级”表示行/观察的类型。我的目标是从另一个dataframe中选择更多的这些类型的行，同时不超过现有数据帧中每个级别类型的最大百分比。我定义了一个命名向量，其级别分配如下： gradeAllocation <- c("A" = 0, "B" = 0, "C" = .25, "D" = .40, "E" = .20, "F" = .10, "G" = .05) 这表示数据帧中每种级别的最大百分比。现在，让我说，我想从另一个数据框架中选择一个混合

浏览 5提问于2014-11-10得票数 0

回答已采纳

1回答

R如何汇总某一列按其他列分解的百分比

、

我有一个这样的数据帧： VisitID | No_Of_Visits | Store A | Store B | Store C | Store D| A1 | 1 | 1 | 0 | 0 | 0 | B1 | 2 | 1 | 0 | 0 | 1 | C1 | 4 | 1 | 2 | 1 | 0 | D1 | 3 | 2

浏览 9提问于2020-03-12得票数 0

回答已采纳

1回答

用python、pandas实现股票数据的存储和计算

、

我正在处理每天使用文件下载的股票数据。该文件每天包含相同数量的列，但行数每天都会发生变化，这取决于进出列表的股票。我希望比较两个日期的文件，并找到之间的总数量列的差异。我想看看这两个文件之间的区别，哪些股票进入了列表，哪些股票退出了列表。我尝试使用pandas数据帧并将其存储在hd5文件中。然后尝试数据帧的合并功能，找出两个文件之间的差异。我正在寻找一个非常优雅的解决方案，以便我可以比较数据帧并找到差异，就像我使用excel的索引和匹配(或vlookup)函数所做的那样。

浏览 3提问于2019-04-18得票数 0

1回答

如何根据其他DF列的分组和值获取DF列的相对百分比

、

我正在尝试根据DF列的分组和另一个DF列的特定值来获取数据帧列的相对百分比。我使用.value_counts()获取每个值的计数，使用.value_counts(normalize=True) * 100获取相对百分比。问题是，当我在切片时使用.value_counts(normalize=True)时，相对百分比都是100。 import pandas as pd df = pd.DataFrame({'state':['AK','AK','AK','AK','AK','AL'

浏览 15提问于2019-07-13得票数 0

回答已采纳

1回答

使用Pandas计算增量列

、

我有一个数据帧，如下所示： Name Variable Field A 2.3 412 A 2.9 861 A 3.5 1703 B 3.5 1731 A 4.0 2609 B 4.0 2539 A 4.6 2821 B 4.6 2779 A 5.2 3048 B 5.2 2979 A 5.8 3368 B 5.8 3216 如您所见，我在"variable“列中有重复的值。我想为A和B之间的每个变量计算增量(%)。我想要生成的数据帧是： Name Variable Field Ref field (A) Delt

浏览 28提问于2019-02-15得票数 4

回答已采纳

1回答

将操作应用于pandas中的组

、

我是python世界的新手，我想知道解决这个问题的正确方法是什么。我的数据帧看起来像这样 import pandas as pd frame={'id_var':[1,2,3,4,5], 'category':['A','A','A','B','B'], 'value':[10,20,30,40,50]} data_frame=pd.DataFrame(frame) 我想通过“类别”列来计算每一行的百分比(“value”列)如何实

浏览 10提问于2020-05-13得票数 1

回答已采纳

1回答

从编程的角度来看，什么是数据帧？

、、

几个数据科学包，例如Python的Pandas，都有一个“数据帧”，所有其他功能都基于这个“数据帧”。从编程的角度来看，到底什么是数据帧？

浏览 1提问于2021-10-20得票数 0

2回答

从pandas df更新数据库中的现有行

、、

我有一个PostgreSQL数据库。Pandas有一个“to_sql”函数，可以将数据帧的记录写入数据库。但我还没有找到任何文档，说明在我使用完dataframe时如何使用pandas更新现有的数据库行。目前，我可以使用pandas read_sql_table将数据库表读取到数据帧中。然后，我会根据需要处理数据。但是，我还不能弄清楚如何将该数据帧写回数据库以更新原始行。我不想覆盖整个表。我只需要更新最初选择的行。

浏览 73提问于2015-04-13得票数 25

1回答

panda dataframe可视化一个类别列的不同值在一个数值列的不同柱子中的百分比

、、

我有一个包含两列col1和class的pandas数据帧。class是二进制的。我想绘制一个直方图，并在col1列的不同框上可视化每个class值的百分比。以下是我的尝试： 1-两个直方图，每个直方图对应class列的每个值： df.col1[df.class == 0].hist() ? df.col1[df.class == 1].hist() ? 2-将它们(类的两个值)放在一个图表中 df.groupby('class').col1.hist(alpha=0.9) ? 正如您从前两个图中看到的，与另一个class==0相比，这些带有class=

浏览 10提问于2020-04-28得票数 1

1回答

GeoPandas数据帧中的标识点(Nan nan)

、、

我有一个带有点几何体的GeoPandas数据帧。dataframe是使用以下代码从Pandas dataframe创建的，该dataframe包含用于easting和northings的单独列： import numpy as np import pandas as pd import geopandas as gpd from shapely.geometry import Point df = pd.DataFrame({'id':[1,2,3,4,5], 'easting':[545200.0,np.nan,360

浏览 26提问于2020-06-19得票数 1

回答已采纳

1回答

熊猫群体价值观的凸显

、、、、

在熊猫中，我有一个多索引的数据，在这个数据中，我希望在每个“计数”列的平均值之上突出每个"Id1“子帧的值。我的实际数据文件要大得多，但下面是一个简化的示例：通过迭代groupby并将样式函数单独应用到每个子帧，我几乎能够得到我想要的东西。 import pandas as pd def highlight_max(x): return ['background-color: yellow' if v > (x.mean()) else '' for v in x] iterables = [["Land", &#

浏览 8提问于2022-03-25得票数 0

回答已采纳

9回答

如何在Python中删除缺少值过多的列

、、、、

我正在研究一个机器学习问题，在这个问题中，特征中有许多缺失值。有100个特征，我想删除那些有太多缺失值的特征(可能是缺失值超过80%的特征)。我如何在Python中做到这一点？我的数据是Pandas数据帧。

浏览 1提问于2017-08-05得票数 9

4回答

Pyspark:有没有等同于pandas info()的方法？

、、、

在PySpark中是否有与pandas info()方法等效的方法？我正在尝试获取有关PySpark中数据帧的基本统计信息，例如:列数和行数、空值数、数据帧大小 pandas中的Info()方法提供了所有这些统计信息。

浏览 4提问于2017-06-08得票数 6

1回答

百分比格式不会更改为float - pandas

、、、

我在将我的数据从数据帧转换为百分比格式并将其保持为浮点数时遇到了问题。我准备了一个简单的代码，它反映了我实际项目中的代码： import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint(0,15,size=(10, 4)), columns=list('ABCD')) print(df) cols = df.columns for col in cols: df[col] = df[col].astype(float).map(lambda n: '{:.4%}

浏览 67提问于2020-10-16得票数 1

4回答

比较两个dataframe列的匹配百分比

、、、、

我想将一个列的数据帧与另一个多列的数据帧进行比较，并返回具有最大匹配百分比的列的标题。我在pandas中找不到任何匹配函数。第一个数据帧第一列： cars ---- swift maruti wagonor hyundai jeep 第一个数据帧第二列： bikes ----- RE Ninja Bajaj pulsar 单列数据帧： words --------- swift RE maruti waganor hyundai jeep bajaj 所需输出： 100% match header - cars

浏览 41提问于2019-06-17得票数 5