如何从pandas数据框中选择包含非重复项的列_基于重复项更改pandas数据框列的值_删除pandas中包含在两列中的重复项 - 腾讯云开发者社区

python、pandas、numpy、dataframe

我有一个具有多次出现特定值的pandas数据框。我希望删除所有重复的值或替换为NaN，并最终获得具有任意数量的唯一值的列的名称。Pandas drop_duplicates函数只删除有重复值的行，但我想删除数据框中的值/单元格。对此有解决方案吗？根据下面的输入数据帧，除了列"02“的第一行之外的所有值在数据帧中都有重复出现，所以列"02”就是我想要的。如果问题不清楚，请告诉我。谢谢。 DF: 02 03:10 03:02 03:02:09 0 6716 45355 45355 45355 1 4047 4047 7411

浏览 56提问于2019-04-02得票数 1

回答已采纳

2回答

在pandas数据框中选择唯一的观测值

python、pandas

我有一个包含uniqueid列的pandas数据框。我想从基于此列的数据框中删除所有重复项，以便所有剩余的观测值都是唯一的。

浏览 0提问于2013-11-01得票数 7

回答已采纳

5回答

从数据帧中删除反向重复项

python、pandas、dataframe

我有一个包含两列的数据框，A和B。在这种情况下，A和B的顺序并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，从数据帧中删除这些重复项的有效方法是什么？ import pandas as pd # Initial data frame. data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50], 'B': [50, 22, 35, 5, 10, 11, 21, 0]}) data A B 0 0 50 1 10

浏览 63提问于2016-11-08得票数 14

回答已采纳

1回答

Python Pandas-根据给定的窗口并从特定值开始计算特定列的总和

python、pandas

我正在尝试在Python Pandas数据框中创建一个新列，其中包含指定范围内另一列的相加值，并从某一行开始。例如，在下面的数据框中，我希望跟踪1的值列的总和从第3行开始(使用索引行号)。但是，我还需要对跟踪2重复相同的标准。此外，我需要从每个跟踪的相同样本号开始。有什么想法吗？

浏览 7提问于2018-07-29得票数 0

回答已采纳

2回答

如何在pandas数据帧中查找包含除NaN之外的所有唯一值的列名？

pandas、unique

我想要查找包含pandas数据框中除NaN以外的所有非重复项的列。 x y z a 1 2 A b 2 2 B c NaN 3 D d 4 NaN NaN e NaN NaN NaN 列"x“和"z”具有除NaN之外的非重复值，因此我希望将它们挑选出来并创建一个新的数据框。

浏览 16提问于2020-05-14得票数 1

回答已采纳

1回答

合并Pandas Dataframe值，但保留列值

python、pandas、dataframe

我有一个包含多个行的pandas数据框，这些行基于id列是彼此重复的，除了它们各自行中的其余值不是重复的。我的目标是将这些行合并到一行中，而不会丢失其余列中的数据。我希望预期的结果如下所示：

浏览 1提问于2020-03-01得票数 0

1回答

将pandas数据帧与序列连接，并将第二个元素相乘

python-3.x、pandas

我有一个包含许多行和列的pandas数据框，如下所示 Name Skill Age Adam C++ 23 Beth Java 25 Micheal Scala 21 ... Aaron Erlang 23 我有另一个列表，我可以从中创建一个熊猫系列 dept = ['Country', 'UK'] pd.Series[dept] s = pd.Series(dept) 现在，我想要连接数据帧，并重复使用列表中的第二个元素的Series

浏览 10提问于2019-01-02得票数 0

回答已采纳

1回答

在组合框和类似控件中处理易失性数据中的不推荐选项

c#、vb.net、forms、combobox

我有一个相当复杂的问题，涉及comboboxes，listboxes，datagridview-comboboxes和类似的控件。最好用其中一部分的例子来描述。本质上，有一个特定的对象(假设它是ERP系统中的一个订单行)，它有一个字段(例如部件号)，它可以保存一个值，这个值可以从另一个数据库表(所有部件编号的列表)中选择。现在有许多零件号码不再被制造出来了。这些都过时了。因此，它们不应再是可选择的。当然，仍然有包含这些数据的旧行，所以简单地从底层数据集中删除过时的值只会导致许多空引用错误。有时，当盒子包含这样的值时，我希望它被完全禁用。更糟糕的是，还可以有其他应用程序修改数据。这些其他

浏览 0提问于2018-09-20得票数 0

2回答

从dataframe中选择几列具有相同值而另一列具有不同值的行

python、pandas、dataframe

我有一个包含四个特征列和一个标签列的pandas数据帧。数据集有一些问题。有些行具有相同的特征值，但标记方式不同。我知道如何查找多个列的重复项 df[df.duplicated(keep=False)] 但是，如何找到标签冲突的重复特征？例如，在数据帧中，如下所示 a b c label 0 1 1 2 y 1 1 1 2 x 2 1 1 2 x 3 2 2 2 z 4 2 2 2 z 我想输出以下内容 a b c label

浏览 92提问于2020-04-10得票数 2

回答已采纳

1回答

从多个pandas数据框列绘制图形

python、pandas、plot

我有一个包含许多列(150)的Pandas数据框，其中140列(第10列到第150列)表示一段时间(通过140天)的天气度值。每列表示不同日期的学位。对于我的数据框中的两行(每行代表一个不同的城市)，我希望绘制所有气象点的趋势，从第一列(第10列)到最后一列(第150列)。我不能设法做到这一点，因为它是数据帧。我应该先创建一个透视表吗？一份清单？你知道如何以一种有效的方式来处理它吗？谢谢

浏览 2提问于2019-04-23得票数 1

1回答

合并单个数据帧内的重复数据

python、pandas、jupyter-notebook

我正在使用pandas库我有一个包含数百个数据部分重复项的大型数据库(一列或两列相同，但其中一列包含附加信息)。我希望合并重复的实例，同时保留具有最多信息的行。我只能弄清楚如何合并两个数据库，而不是一个单一数据库中的数据。示例： Col 1: Name, Col 2: Age, Col 3: Other, Col 4: Other, Col 5: Other Row1 Aaron Miser, 32, Plumber, 4 Children, NaN Row2 Aaron Miser, 32, NaN, NaN, NaN Row3 Aaron Miser, 3

浏览 0提问于2019-02-06得票数 0

2回答

在pandas中堆叠与Pandas / SFrame等效的列表数组

pandas、sframe

在pandas数据帧中是否有SFrame堆栈的等价物？Pandas自己的堆栈只适用于级别，而我正在寻找在包含列表的其他列的同一级别上扩展单个列。 Input Dataframe:在实际数据框中还有一些像user这样的列 +-------+------------------+ | user | friends | +-------+------------------+ | 1 | [2, 3, 4] | | 2 | [5, 6] | | 3 | [4, 5, 10, None] | +----- -+-------

浏览 5提问于2017-08-19得票数 1

回答已采纳

1回答

如何提取pandas数据框列中的数据框

python、pandas、dataframe、data-analysis、exploratory-data-analysis

从pandas数据框(3* 5)中，如何将一列(包含数据框对象的行作为值(每行数据框2* 10) )提取到单独的数据框(6* 10行) log_df['df_inside'] = log_df['input'].apply(lambda x :parser(x)) parser(x)在应用之后为每一行返回一个数据帧(2* 10)。在上述步骤之后，如何从日志条目中提取df_inside数据帧？

浏览 22提问于2021-06-22得票数 0

1回答

带有数据源的DataGridView组合框列

vb.net、winforms

包含从创建者手工创建的4列的datagridview。第1、第2和第3列只是文本框列，但最后一列被标记为组合框列。用户可以在单击某个按钮时添加行。前三列的值从某些文本框开始。问题是当用户添加自己的行时，我必须填充combobx列。到目前为止，我尝试的是这样的： dgvMaterials.Rows.Add(material, rodzajName, rodzajID, new Variation().GetAll()) 注意，GetAll函数恢复了datatable中的数据，其中包括Id和名称。Id应标记为值成员，名称应标记为显示成员。因此，简单地说，用户单击表单树第一列的字段中的某个按钮从

浏览 0提问于2016-07-11得票数 1

1回答

如何使用pandas从csv中的2列中获取重复值列表

python、pandas、csv

我是pandas的新手，我正在尝试从CSV文件的2列中获取重复值的列表，我的数据框如下所示： df = pd.read_csv('file.csv') PID1 PID2 1 2 2 3 3 3 4 4 5 6 6 7 7 8 7 9 7 9 我试过使用这个： df.drop_duplicates('PID1', 'PID2', inplace=True) print(df) 但我认为它不适用于2列。预期的输出要么是向我的CSV文件

浏览 0提问于2019-10-23得票数 1

1回答

如何将set函数应用于特定列的所有行，该列的条目是具有重复值的列表？

python、pandas

在我的pandas数据框中，我有一个列，该列的每一行都是一个具有重复值的列表。例如，一个有3行的数据框：df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想要删除重复项。我的预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用set函数来删除每个列表中的重复项？提前感谢！

浏览 13提问于2020-08-03得票数 0

回答已采纳

6回答

检查区域中唯一单元格的数量

excel、excel-formula、worksheet-function

我有一张excel表格。在E列下，我有425个包含数据的单元格。我想检查相同的数据(即单元格中的文本)是否在E列下剩余的424个单元格中的任何其他位置重复。我该如何做？例如，在E54中，我有 Hello Jack 我如何检查这个值，看看它是否在这些单元格中的任何其他单元格中？

浏览 2提问于2012-08-21得票数 3

1回答

如何计算具有稀疏向量的两个pandas列的每一行之间的点积

python、pandas、scipy、sparse-matrix、dot-product

我有一个包含两列的Pandas数据帧，每列中的每一行都包含一个SciPy稀疏向量。这些向量是csr矩阵的行(因此它们实际上是形状为1x8500的矩阵)。我需要创建另一列，它的每一行都应该包含同一行前两列向量之间的点积。我知道如何在每一行上使用apply / map来做到这一点，但是当我处理具有数百万行的数据集时，这需要花费很长的时间。有没有更快的方法在整个数据帧上做到这一点？除了点积之外，我还需要计算余弦相似度，但据我所知，这可能是从点积得到的。更新:我不能在这里分享实际的数据，但这里有一个玩具示例(请注意，我现在只有结果数据帧)： import pandas as pd import

浏览 0提问于2017-05-30得票数 0

1回答

WPF -通过LINQ匿名类型设置ComboBox项目索引和项目值

wpf、linq、combobox、anonymous-types

我想从数据库表的两列中检索数据，并将这两列分别绑定到combobox项索引和项值属性。我使用这个匿名查询从数据库的samples表中检索数据： var result = from obj in context.Samples select new { obj.ID , obj.Name }; 我希望将组合框中每个项目的默认索引值设置为obj.ID，并将每个相应组合框项目的值设置为obj.Name，这样组合框中的项目就不会具有从0，1，2开始的默认值。它们的索引值将具有由我的LINQ查询返回的obj.ID的值，并且项的实际值将是obj.Name。抱歉，如果这是一个愚蠢

浏览 1提问于2011-08-28得票数 1

回答已采纳

4回答

如何从pandas数据框中选择包含非重复项的列

python、pandas

我想从pandas数据框中选择包含非重复项的列，并使用这些列组成一个子集数据框。例如，我有一个这样的数据框： x y z a 1 2 3 b 1 2 2 c 1 2 3 d 4 2 3 列"x“和"z”具有非重复值，因此我希望将它们挑选出来并创建一个新的数据框，如下所示： x z a 1 3 b 1 2 c 1 3 d 4 3 可以通过以下代码实现： import pandas as pd df = pd.DataFrame([[1,2,3],[1,2,2],[1,2,3],[4,2,3]],index=['a

浏览 26提问于2019-03-22得票数 3

回答已采纳

2回答

当两个pandas数据帧包含相同的行，但一个数据帧多次包含该数据帧时，找出它们之间的差异

python、pandas、dataframe

我有两个熊猫数据帧 df1 jon,12,NewYork jon,12,NewYork james,14,LA df2 jon,12,NewYork james,14,LA 我想将它们进行比较，并得到下面的差异 deltaDF jon,12,NewYork 我尝试过pd.concat([df1,df2,df2],axis=0,sort=False).drop_duplicates(keep=False)，当没有重复项时，它工作得很好，但当其中一个数据框包含重复项而其他数据框只有一个条目时，它没有区别。我还尝试了Python Pandas - Find difference between t

浏览 33提问于2020-01-17得票数 1

回答已采纳

1回答

使用语音对文本进行标准化

asp.net、sql-server

我从数据中心收到数据，我必须清理数据并使其有用，我最大的问题是有一列让我们称其为"service_description“，例如，数据中心属于一家美发沙龙，这一列是手动填充的(文本框)，包含大量数据(数十亿)，下面是一个小示例 service description washed the haair hair washed and dried used shampoo on har nails manicure nail paint nail pant paint the nails 我需要做的是通过破坏一个脚本来分析每一行并指定类别，从而将每个类别组合在一起。例如，头发可能是前三

浏览 3提问于2013-05-25得票数 2

回答已采纳

1回答

在R中合并会产生比其中一个数据框更多的行

r、merge、dataframe、rstudio

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

3回答

在dataframe列中放置最长字段

python、python-3.x、pandas

我有一个有三列的pandas数据框，都是文本。如何创建一个只包含三列中最长的文本的新列？我将长度定义为简单的字符计数。

浏览 24提问于2019-04-16得票数 1

回答已采纳

1回答

当为Min_count=1时，分组总和等于0

python、pandas

我有一个包含重复列名的dataframe。现在，我正在尝试使用以下命令将重复的列组合到单个列中(以下数据帧仅用于演示。它不包含重复的列名，但重复的列名也会出现同样的问题)。 d=pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]}) d['col2']=d['col2'].astype(str) d['col1']=np.nan d=d.groupby(lambda x:x, axis=1).sum(min_count=1) the output is: col1

浏览 3提问于2018-11-25得票数 2

10回答

如何将Pandas数据框中的字符串转换为“date”数据类型？

python、date、pandas

我有一个熊猫数据框，其中一列包含YYYY-MM-DD格式的日期字符串例如，'2013-10-28' 目前，该列的dtype是object。如何将列值转换为Pandas日期格式？

浏览 2提问于2013-05-31得票数 128

回答已采纳

2回答

使用Google脚本查找并使用定义范围内的最新数据替换重复行

javascript、google-apps-script、google-sheets、spreadsheet

使用A:M列的Google每天都会手动地在B列中的下一行粘贴一组新的原始数据(大约30行)。此原始数据包含自前一天以来已更新的列内容的重复行。列C包含用于确定重复项的作业编号，列A包含从1到n的顺序ID。我需要创建一个基于C列查找重复行的函数，然后使用具有最大列A值的行覆盖最低列A值中的数据，这样一旦作业在工作表中，添加到工作表中的作业编号的顺序就不会改变。图像中的；第4行的作业22,484将更新为10/5/22，第5行的作业数据将被删除。对于每一天的原始数据，将有20-25个重复条目。使用的最大行数为5000行，因此如果有必要，脚本可能会效率低下。谢谢!康纳这是！(谢谢迈克)

浏览 22提问于2022-05-11得票数 1

回答已采纳

1回答

如何选择与熊猫重复的行？

python、pandas、dataframe、subtraction、divide

我有这样的数据： import pandas as pd dic = {'A':[100,200,250,300], 'B':['ci','ci','po','pa'], 'C':['s','t','p','w']} df = pd.DataFrame(dic) 我的目标是将行分隔为2个数据格式： df1 =包含不沿B列重复值的所有行(非the行)。 df2 =只包含重复主题的行。

浏览 4提问于2016-12-08得票数 13

回答已采纳

1回答

有条件地删除重复的pandas python

python、python-2.7、numpy、pandas、dataframe

有没有办法有条件地在大约10列和400,000行的pandas数据框中删除重复项(特别是使用drop_duplicates )？也就是说，我希望所有有2列的行都满足一个条件:如果date (column)和store (column) #的组合是唯一的，则保留行，否则删除。

浏览 1提问于2015-05-03得票数 8

1回答

Pandas -向DF href添加列

python、python-3.x、pandas、web-scraping、beautifulsoup

我正在做一个网络抓取脚本。生成的pandas数据框非常棒，但是我需要添加一个包含在HTML中的href URL值的unique_id列。 <td><a href="/admin/tasks/edit/82689"> ADDRESS </a> CLIENT </td> 目前Pandas数据框有一个包含'ADDRESS CLIENT‘的列，但是我如何添加一个包含href URL的单独列呢？我目前可以使用以下内容获取逗号分隔的unique_id值列表： unique_id = [a['href'] for a

浏览 1提问于2018-08-06得票数 0

回答已采纳

1回答

如何删除具有多个条件的pandas中的列

python、pandas、dataframe

我刚接触python和pandas 在下面的数据框中，我需要删除完全为" None“的列，其中包含"blanks None"，但不删除包含值和None的列 ? 在上表中，我希望删除列A和列C，因为它们完全是“无”或“空白和无”，但是列B至少在3个单元格中有一些有效数据，它不应该被干扰如何在df.drop (pandas)中给出这个条件

浏览 48提问于2021-11-11得票数 0

回答已采纳

3回答

是否有方法在运行时清除列表框中的空白值？

c#、asp.net

我从数据库中的表中提取数据，并将其作为数据源分配给列表框。如果列表框中有一个空白项，它将显示如下所示： AllRedGreenBlue 删除列表框中空白的最佳方法是什么。如果有一个空白，它总是在第二个位置。我本打算试着测试第二个位置是否包含空白文本，但我不知道该如何做。谢谢，XaiSoft

浏览 2提问于2009-02-12得票数 1

回答已采纳

1回答

如何从CSV文件的原始数据构建数据框

pandas、csv、dataframe、pandas-groupby

我目前正在学习python环境来处理传感器数据。我有一块板，上面有32个传感器，读数是温度。在以下链接中，您可以找到原始数据的摘录：https://5e86ea3db5a86.htmlsave.net/ 我正在尝试使用pandas从CSV文件中构建一个按日期分组的数据框(请参见表https://docs.google.com/spreadsheets/d/1zpDI7tp4nSn8-Hm3T_xd4Xz7MV6VDGcWGxwNO-8S0-s/edit?usp=sharing的潜在结构到目前为止，我已经读取了pandas中的数据文件并删除了所有未命名的列。我正在努力创建一个柱传感器ID，

浏览 28提问于2020-04-20得票数 0

1回答

如何使用预定义的值随机填充pandas dataframe中的分类列

python、pandas、dataframe

我有两个熊猫数据框，第一个包含50多个城市的名称，第二个包含客户详细信息，如姓名，年龄，性别，薪水，职业等。这些数据框之间没有公共关键字，它们的大小也不同。我希望在客户详细信息数据框中填充一个名为'Customer City‘的新列，该列应该具有从城市数据框中选择的值。换句话说，对于客户，我希望选择一个随机的城市(从城市数据框中)，并将其添加到客户数据框中名为“customer city”的新列中。请建议如何在熊猫身上做到这一点。

浏览 21提问于2020-05-18得票数 0

回答已采纳

1回答

子例程在删除重复行时错误地删除剩余的列数据

vba、excel、listbox、listboxitem

我正在重新设计一个子例程，以便从列表框中删除重复的行；列表框的"ColumnCount“属性设置为"13”。如果我不调用删除重复项的子例程，则列表框将正确地包含所有数据列；但是，有几行数据是重复的。下面列出了该子例程： Private Sub RemoveDuplicateListBoxRows() Dim i As Long, j As Long Dim nodupes As New Collection Dim Swap1, Swap2, Item With Me.lbSrchMatchingResults For i =

浏览 0提问于2015-11-21得票数 0

1回答

使用Pandas查找特定列的行数。

python、pandas、dataframe、data-cleaning

从给定的数据框架中，我需要一个新的数据框架，它只包含使用Pandas重复三次的特定列的行。就像。如果输入的Dataframe是然后，我的输出数据框架只应该是重复三次"NAME“的行。

浏览 6提问于2021-12-21得票数 0

回答已采纳

1回答

如何使用基于2D数组或google工作表中的滴答框行和列的数据验证？

google-sheets、google-sheets-arrayformula、microsoft-excel、excel-online

在这里，我是附加的部分，在工作表，其中包含滴答框。 📷 目的是将A列设置为绿色或红色背景颜色。规则：如果A行的任何勾选框包含真值，则列A中的数据应为绿色。 A列中的数据应该是红色的，如果该行的行中没有勾选框为真的话。在这里，我尝试手动重复公式。 📷 注意:我也尝试使用$B$2、$B2或B$2的所有其他组合。假设:它最多有17列，最多有Kth列。

浏览 0提问于2022-11-03得票数 0

2回答

基于列表中的数值列和索引从pandas DataFrame创建新列

python、pandas、dataframe

我有一个数据框，其中包含一个数值列和一个包含字符串作为元素的列表。我想在该数据框中创建一个新列，其中数字列中的每个数字都对应于列表的索引。示例： import pandas as pd bar = ['cat','dog','chicken'] df = pd.DataFrame({'foo':[0,0,1,1,2,2]}) 预期输出： foo bar 0 0 cat 1 0 cat 2 1 dog 3 1 dog 4 2 chicken

浏览 13提问于2020-02-27得票数 0

回答已采纳

1回答

Python - Pandas - Graph vs dict？(Networkx)

python、pandas、graph、networkx

我刚接触python-grpahs的世界。我有一个熊猫数据框中的数据，格式如下。源列包含馈送到目标列的值。所以我需要建立一个图或字典，当我请求'D‘输入的值时，它会给我一个列表C，B，A。我正在研究Networkx提供的处理pandas数据帧的选项。在这方面的任何帮助都是值得感谢的。 df = Target Source A B B C C D

浏览 6提问于2018-01-10得票数 0

3回答

Python Pandas-查找值超过阈值的第一个实例

python、pandas

我正在尝试根据另一个Python Pandas数据框列查找超过阈值的值的第一个实例。在下面的代码中，"Trace“列对于多个行具有相同的编号。我想要找到"Value“列超过3的第一个实例，然后，我想从该行获取其余信息，并将其导出到新的Pandas数据框中(如第二个示例所示)。有什么想法吗？ d = {"Trace": [1,1,1,1,2,2,2,2], "Date": [1,2,3,4,1,2,3,4], "Value": [1.5,1.9,3.1,5.5,1.1,3.6,1.9,6.2]} df = pd.DataFrame

浏览 24提问于2018-07-29得票数 3

回答已采纳

2回答

Pandas中的.duplicated()方法在值中是否有模糊匹配？

python、pandas、dataframe、fuzzy-logic

我正在为我的数据科学课程做一个练习，其中涉及一个数据集，其中包含几条关于Google Playstore应用程序的信息。该练习要求删除任何重复的行和列，并填充任何丢失的数据。检查列，他们都很好，没有重复。因此，我只检查重复项可能有问题的列，即dataset的“App”列。毕竟，其他数据可以而且很可能会重复，因为它是所有人共享的信息，因此我的理由是过滤掉'App‘列中的重复项。这就是问题所在:我使用了duplicate方法。通过添加这个序列，我可以得到有多少行是重复的-通过使用.loc方法，我可以提取它们的实际值。我使用了以下代码： df_pst.loc[df_pst.duplic

浏览 19提问于2021-06-15得票数 0

1回答

如何根据B列中的特定值找到A列中一组记录的最低值？

python、pandas

我在一个包含超过1000行的数据框中有两列。列A可以接受值X、Y、None。列B包含从50到100的随机数。每次在A列中出现非'None‘时，它都被视为occurrence4。因此，列A中的前一个非出现项将为occurrence3，前一个为occurrence2，前一个为occurrence1。我想找到occurrence4和occurrence3之间的B列的最小值，并检查它是否大于occurrence2和occurrence1之间的B列的最小值。可以将结果存储在数据框中的新列中，作为“是”或“否”。样本输入 ? 例如，我需要找出ROWNUM 14和ROWNUM 11之间的B

浏览 11提问于2019-09-26得票数 0

回答已采纳

1回答

使用python从电子表格中提取最后一个行值-遇到'NoneType‘

python、excel、openpyxl

我正在使用openpyxl提取Excel电子表格的最后一行： import openpyxl wb = openpyxl.load_workbook('Folder/File.xlsx') sheet = wb.active last_row = sheet.max_row 这从sheet.max_row返回44。但是在电子表格的最后几行中没有值，它们是空白的。 type(sheet['A44'].value)返回NoneType。我想提取最后一行(在本例中为37行)中的值，并将其附加到Pandas数据框中。如何忽略最后一行电子表格中的NoneType值？

浏览 10提问于2017-01-31得票数 1

回答已采纳

1回答

在不包括公共栏的情况下在熊猫上表演两次

python、pandas

来自Pandas文件： result = pd.concat([df1, df4], axis=1, join='inner') 如果没有两次包含公共列，我如何执行concat操作？我只想把它们包括一次。在本例中，B和D列在concat之后重复两次，但具有相同的值。

浏览 1提问于2020-11-16得票数 1

回答已采纳

3回答

根据列的最大值在Excel中有条件地去重

excel、duplicates、filtering、conditional-statements

我在Excel中有一个由两列组成的数据，看起来像这样:第一列是一个值，第二列包含一个相应的单词。但是，我希望删除此数据集中的行，这样，最后，对于第二列中的每个唯一字，只保留列一中的值是该字的最大值的一行，甚至删除那些具有每个唯一字的最大值的重复的行，并为每个唯一字保留一行。 2 cat 2 cat 1 cat 3 dog 2 dog 1 dog 2 milk 1 milk 2 juice 1 juice 列首先按列2排序(因此单词按字母顺序: A-Z)，然后按列1排序(从最大到最小，因此最大值始终是每个单词的第一个值)。我一直在尝试在Mac2011的E

浏览 2提问于2015-04-20得票数 2

回答已采纳

1回答

无法在Pandas中创建折线图

python、pandas、dataframe、plot

使用Pandas进行分析的第二天，我现在正在尝试利用它的绘图功能。我在从数据框创建折线图时遇到了问题，该数据框是在对按日期(以年为单位)分组的列求和后得到的。我想要的图应该显示全年订单量的增长，所以日期应该是X轴，订单应该是Y轴。我的导入如下： import pandas import matplotlib.pyplot import seaborn as sns 我有一个包含所有信息的主数据框架，从那个df中，我制作了另一个只包含一列总和的数据框架。 ordersYears = rawData.groupby(rawData['Date'].dt.year)['T

浏览 12提问于2019-12-04得票数 1

回答已采纳

1回答

Pandas:创建新的数据帧，平均来自另一个数据帧的重复数据

python、pandas

假设我有一个包含列重复项的数据帧my_df，例如.. foo bar foo hello 0 1 1 5 1 1 2 5 2 1 3 5 我想创建另一个对重复项取平均值的数据帧： foo bar hello 0.5 1 5 1.5 1 5 2.5 1 5 我如何在Pandas中做到这一点？到目前为止，我已经成功地识别了重复项： my_columns = my_df.columns my_duplicates = print [x for x, y in collections.Counter(my_columns).items()

浏览 0提问于2013-05-22得票数 7

回答已采纳

2回答

Python:合并文件和删除重复项

python、pandas、duplicates

我有3个excel文件，每个有4000行和5列。我希望将excel文件合并到一个数据框中，并删除重复的行。随后，我希望将结果发布为excel文件： import pandas as pd import numpy as np filenames = ['Sample_a.xlsx','Sample_b.xlsx','Sample_c.xlsx'] dataframes = [pd.read_excel(f) for f in filenames] new_dataframe = df.dropduplicates(datafra

浏览 1提问于2018-10-31得票数 1

1回答

Pandas DataFrame不会旋转。表示重复的索引

python-3.x、pandas、pivot-table

所以基本上我的数据框中有3列，如下所示： <class 'pandas.core.frame.DataFrame'> Int64Index: 158143 entries, 0 to 203270 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 users 158143 non-null int64

浏览 12提问于2020-04-14得票数 0

回答已采纳

2回答

将pandas df写入Excel并将其保存为副本

python、excel、pandas

我有一个pandas数据框，我想打开一个包含公式的现有excel工作簿，将数据框复制到一组特定的列中(假设从A列到H列)，然后用不同的名称将其另存为一个新文件。其思想是更新现有的模板，用一组指定的列中的数据帧填充它，然后用不同的名称保存Excel文件的副本。有什么想法吗？我所拥有的是： import pandas from openpyxl import load_workbook book = load_workbook('Template.xlsx') writer = pandas.ExcelWriter('Template.xlsx'

浏览 0提问于2016-03-11得票数 1