pandas中的重复行追加到for循环中_列中的重复行- python/pandas_Pandas删除行中的重复项 - 腾讯云开发者社区

、、、

我在函数内部的for循环中遇到了问题。我正在计算单词向量列表的余弦距离。对于每个向量，我计算余弦距离，然后将其作为新列附加到pandas数据框中。如果发生这种情况，我还要求在pandas dataframe中添加0值。这会导致重复的索引，并且我会坚持从这里向前移动。0，而是创建一个值为0的新的重复行。对于每个不存在的单词，它不是

浏览 9提问于2021-01-29得票数 0

回答已采纳

2回答

在写入CSV时操作Pandas输出

、、、

我正在试着写一些能做以下事情的东西：读取超过1m行、100列数据的CSV；按照从最大行到最少行的顺序列出重复行的出现情况来总结每列到目前为止，我所拥有的： import pandas as pdto_csv(outfile, mode='a') 下面的代码输出如下： ColumnA,0qwer,10ColumnB,0jkl,8 我更希望在excel中</

浏览 31提问于2020-08-24得票数 0

回答已采纳

3回答

在for循环中使用pandas* .append*

、、、

我在for循环中将行附加到pandas DataFrame，但最后数据帧始终为空。我不想将行添加到数组中，然后调用DataFrame构造器，因为我的实际for循环处理大量数据。下面是一个虚拟的例子：import numpy as np for i in np.arange(0, 4)

浏览 1提问于2016-05-04得票数 45

回答已采纳

2回答

从Excel中读取3000张工作表并将其上传到Pandas* Dataframe的最佳/最快方法*

、、

我目前正在逐个读取工作表，将其转换为数据帧，添加到列表中并重复。for循环中的一次迭代大约持续90秒，这是一个巨大的时间。每个工作表有大约35行5列的数据。有人能提出一种更好的方法来解决这个问题吗？这是我的代码： import pandas as pdnr_pages_workbook =

浏览 18提问于2019-05-10得票数 0

回答已采纳

1回答

使用pandas将相同的值添加到其他行

、

我是pandas的新手，我的第一个脚本是将两个工作表合并为一个工作表。我在多个行中有很多重复的数据，如果有意义的话，我希望将一列中的相同值添加到其他重复行中。例如当我加入这两张纸时，我得到了例如，我该如何将电话号码值添加到j

浏览 13提问于2020-06-11得票数 0

1回答

连续几行熊猫数据的重复计算

、、、、

我想计算GPS坐标路径上的距离，它存储在数据帧中的两列中。因此，可以按以下方式计算数据的第一行和第二行之间的距离：r2 = 1 m.cos(df.lat[r1]) * m.cos(df.lat[r2]) * m.cos(df.lng[r2]-df.lng[r1]))*6371

浏览 3提问于2017-04-17得票数 4

回答已采纳

3回答

以累积方式合并具有相同索引的行

、、、

在python pandas中，我有一个数据帧，看起来像这样： > dfdate 2021有些日期是重复的，具有不同的计数值。我想将这些值合并到一行中，如下所示： > dfdate 2021-04-04 22.0 2021可能有一种方法可以

浏览 20提问于2021-05-06得票数 0

回答已采纳

3回答

在循环中将字典附加到pandas数据帧

、、

我需要在循环中创建一个字典，并将它们附加到具有匹配的dict键名和数据框的列名的pandas数据框中。每次迭代中字典的键值对可以是不同的。在字典中使用所有可能的关键字在开始时定义了空的熊猫数据帧df_podcast。tag=="key":

浏览 0提问于2017-05-14得票数 9

回答已采纳

4回答

在linq中，在“添加到列表”之前存在“检查”之间的性能。

、、

在foreach循环中，我想将产品添加到列表中，但是我希望这个列表不包含重复的产品，目前我有两个解决方案。1/在循环中，在将Product添加到列表之前，我将检查产品是否已经存在于列表中，否则我将将它添加到列表中。在循环中，即使有重复的产品，我也会将所有产品添加到列表中。然后，在循环之外，我将使用Distinct来删除

浏览 1提问于2018-07-25得票数 2

回答已采纳

2回答

几页的pd.read_html

、、

这正是我想要得到的。而页面的urls仅与最后一个数字不同。我是否可以使用pd.read_html获取所有表并将表合并到一个表中？import pandas as pd url_head = 'http://www.kmzyw.com.cn/jiage/today_price.html?

浏览 6提问于2017-07-16得票数 1

回答已采纳

1回答

从文件中读取多个熊猫DataFrames

、

你好，我正在尝试读取多个文件，创建一个包含我需要的特定密钥信息的数据，然后将每个文件的每个数据main附加到一个称为主题的主数据main中。我试过以下代码。import pandas as pdfrom lxml import etreefordf.iloc[:,3:]然而，当我调用主题时，我得到了以下输出

浏览 0提问于2018-06-02得票数 1

回答已采纳

1回答

如何正确地将字典的值追加到空的数据帧中？

、、

您好，我正在尝试创建一个将在for循环中添加行的dataframe。因此，我决定首先创建一个空版本的dataframe，然后为新行创建一个字典，并在循环的每次迭代中将该字典附加到dataframe。问题是数据帧中的值与字典中的值不匹配：我创建了一个空的数据帧，如下所示： import pandas df = pandas.DataFrame({"a&q

浏览 30提问于2021-07-13得票数 0

回答已采纳

1回答

使用pandas* df.drop()而不是pandas删除数据框中的重复行*

、、、、

我有一个包含2018、2019、2020和2021年数据的数据框。有时会有重复的行，但由于索引不同，pd.drop_duplicates无法工作，经过几个小时的故障排除后，我决定在清理数据集时删除所有可能有重复行的行；但是，当我运行下面的代码并拉出新的干净的pandasdf时，我在for循环中删除的行不会从df中</em

浏览 17提问于2021-11-19得票数 0

2回答

将URL中的文本清除为CSV，然后将其表示为Pandas* Dataframe*

、、、、

import csvimport pandas as pd import time while True:time.sleep(60.0 - ((time.time() - starttime) % 60.0)) 我编写这段代码的目的是从URL中提取数据，并将其放在Pandas Dataframe中。目前，我能够将原

浏览 0提问于2018-11-01得票数 0

回答已采纳

1回答

如何加快在数据框列中查找重复项的速度

、、

我希望找到在dataframe列中出现重复值序列的索引。我希望结果是一个列表列表，其中每个子列表都是重复值索引的单个序列。我当前的代码可以工作，但相当慢(10000行数据帧中10%重复的apx 15毫秒)：import numpy as npdef duplicate_ranges(df,

浏览 0提问于2017-03-03得票数 0

1回答

熊猫不起作用，没有任何差错吗？

、

我试图在一个循环中将一些数据附加到一个空的Pandas系列中。pd.Series([int(df_train.iloc[[0],[i]].values)]) i += 1我创建了一个临时的Pandas系列，以在一个特定的索引上存储来自我的dataframe的值(特别是我对第一行的列值1-200感兴趣

浏览 3提问于2022-04-13得票数 1

回答已采纳

1回答

获取多行ith重复索引并输入i个数据格式。

、、

我有一个有重复索引的数据，如下所示。6.135689, 5.945807] df.index = [1,1,1,1,1,2,2,3,3,3,4] 我希望将每个数字的第一个重复索引的行追加到df1，第二个重复索引的行添加到df2等；第一次索引1、2、3、4.N有一个重复</em

浏览 10提问于2022-08-08得票数 0

回答已采纳

2回答

为什么"rows[" epic_week“] =epic_week”不起作用？

、

我尝试在pandas数据框中添加一个新列。当我想通过使用iterrows()函数来更新时，"rows"epic_week“= epic_week”不起作用。

浏览 14提问于2020-09-18得票数 0

1回答

为什么psycopg2 INSERT在循环中运行需要这么长时间，我如何加快它的运行速度？

、、、

我试图在for循环中使用psycopg2 insert将(source_lat，source_long，destination_lat，destination_long)行从Pandas数据帧插入到PostgreSQL表(Gmap)中。该表有一个完整性约束，可以防止插入重复的(source_lat、source_long、destination_lat、destination_long)行，所以我使用try except block来捕获任何重复<em

浏览 15提问于2019-08-03得票数 1

2回答

pandas DF中的重复行

、、、

我在Pandas中有一个DF，它看起来像：A 1A 2B 1B3C 2B 2 1C 2 2 我想要做的一个例子是。我想出的最好的办法是使用count_values()，但我认为这只是一个专栏。另一个想法是

浏览 0提问于2014-09-02得票数 11

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云