从pandas数据帧高效地创建边缘列表

可以通过以下步骤实现：

首先，我们需要导入pandas库并读取数据帧。可以使用pandas的read_csv()函数从CSV文件中读取数据，或者使用其他适合的函数根据数据源的类型读取数据。
接下来，我们可以使用pandas的groupby()函数将数据帧按照边缘的列进行分组。边缘列表是指将数据帧中的某一列作为边缘，将其他列作为该边缘的邻居。
然后，我们可以使用pandas的apply()函数对每个分组应用一个自定义函数，该函数将邻居列的值转换为边缘列表。在自定义函数中，我们可以使用pandas的unique()函数获取邻居列的唯一值，并将其转换为列表。
最后，我们可以将边缘列表保存到一个新的数据帧中，以便进一步处理或分析。

下面是一个示例代码：

import pandas as pd

# 读取数据帧
df = pd.read_csv('data.csv')

# 按照边缘列进行分组
grouped = df.groupby('edge_column')

# 自定义函数，将邻居列的值转换为边缘列表
def create_edge_list(group):
    neighbors = group['neighbor_column'].unique().tolist()
    return neighbors

# 对每个分组应用自定义函数
edge_list = grouped.apply(create_edge_list)

# 创建新的数据帧保存边缘列表
edge_df = pd.DataFrame(edge_list, columns=['edge_list'])

# 打印结果
print(edge_df)

在这个示例中，我们假设数据帧中有两列，分别是边缘列和邻居列。我们首先按照边缘列进行分组，然后对每个分组应用自定义函数create_edge_list()，将邻居列的值转换为边缘列表。最后，我们将边缘列表保存到一个新的数据帧edge_df中，并打印结果。

请注意，这只是一个示例代码，具体的实现方式可能因数据的结构和需求而有所不同。在实际应用中，您可能需要根据具体情况进行适当的调整和优化。

页面内容是否对你有帮助？

有帮助

没帮助

从pandas数据帧高效地创建边缘列表

、

我有一些出版物数据想要做合著性分析。数据帧如下所示： Author Title Pub_date City John A.Paper 2 2020-02-01 Chicago 我想创建一个未加权的、无方向的边缘列表，它将出版物数据保留为边缘属性，如下所示： Node1 Node2 Title

浏览 5提问于2020-12-10得票数 0

1回答

从pandas数据帧创建边缘列表非常慢

、、

blue elephants" | ["red", "bird", "blue", "elephant"] | +-------+---------------------------

浏览 21提问于2019-05-11得票数 1

回答已采纳

1回答

使用networkX创建图形

、、

我试图使用以下代码为这个创建一个图形：import csv我已经搜索了错误，并理解我需要传递一个不可变的数据结构如何以图表的形式捕获完整的数据？

浏览 1提问于2021-11-17得票数 0

回答已采纳

2回答

Pandas惯用的将json列表映射到dataframe的方式

、、

我有一个从json输入派生的数据集，我希望将其映射到pandas dataframe。使用pandas.DataFrame.from_dict或pandas.io.json.json_normalize加载这类字典的列表，会产生一个包含两列的数据帧: foo和bar。df = pd.DataFrame.from_dict([popo] * 10, orient='index') 在一个完美的世界里，我想让df‘’bar‘去引用一个形

浏览 46提问于2019-03-04得票数 2

2回答

从pandas数据帧生成边缘列表

、、

假设我有一个像这样的熊猫数据帧：0 Apple Orange Peach columns=['Fruit_1', 'Fruit_2', 'Fruit_3']) 我想生成一个边缘列表

浏览 1提问于2017-02-25得票数 1

2回答

如何从pandas数据帧创建多关系边缘列表？

、、、

我有一个像这样的熊猫数据框架： from pandas as pd Src Dst1 a c3 b c5 c d 我需要基于df_rel的col2中的共享元素的新数据

浏览 0提问于2020-07-02得票数 0

2回答

将根据给定需求选择的某些行放入另一个数据帧中

、

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

2回答

从数据帧创建边缘列表

、、

peter john 5我正在探索一些选择，包括使用for循环，但我有点担心这可能需要太长时间，因为我的数据集变得非常大

浏览 24提问于2017-12-29得票数 0

回答已采纳

2回答

创建pandas数据帧:在numpy上映射函数

、、、

我正在创建一个pandas数据帧，并使用numpy来模拟值。我想将随机生成的in分配给pandas中的两列，为此，我编写了一个返回字母数字in的函数。我需要为每一行提供唯一的ids，因此需要高效地迭代pandas数据帧。理想情况下，.apply可以做到这一点，但是，我需要在创建pandas数据帧时完成这项工作。

浏览 20提问于2020-07-04得票数 1

回答已采纳

1回答

逐行高效地构建pandas数据帧

、、

我最近一直在通过迭代多个文件、行等来构建pandas数据帧。我一直在通过在字典中附加项目，然后转换为数据帧来构建它们：据我所知，还有其他工具，如apply()和interrows()，用于逐行应用或筛选数据。这不是这个问题的主题。我还没有把它和pandas.DataFrame.append做比较。关于append，我有两个想法。一方面，创建一个(单行的)数据帧或序列只是为了追加它，这似乎是不必要的繁重。另一方面，内

浏览 0提问于2017-02-23得票数 5

2回答

高效地将大型pandas数据帧转换为列表

、、

我想要将一个大型熊猫数据帧中的前50项转换为一个列表，对于数据帧中的每个索引，该列表将具有该值。即使dataframe在该索引中没有任何值，我也希望该列表的值为0。例如，pandas数据帧，如下所示：0 202 605 2049 65.将被转换为以下列

浏览 5提问于2018-09-06得票数 3

1回答

从pandas* dataframe中选择特定行*

、、

我在pandas数据帧中执行了group by，以查看每个位置和每个日期有多少行。agg_count = df.groupby(['date', 'location']).count() 现在，我希望看到这个新数据帧中满足特定条件的行。比如说，计数大于50。我如何高效地迭代这个巨大的数据帧来获得这些行？

浏览 1提问于2013-03-26得票数 1

回答已采纳

2回答

如何在pandas中向量化动态大小的numpy数组

、、、、

目前，我在我的数据帧上使用apply方法，以便创建一个包含可变大小列表的计算列(取决于length列中的值)。import numpy as np df = pd.DataFrame({'a': [1, 2, 3, 4, 5], 'b': [

浏览 1提问于2020-09-04得票数 4

1回答

使用pandas数据帧高效地搜索数据

、、

也就是说，对于每个客户(从10个客户)，我想从file1的cust_id，fname，lname，并将结果放在新的csv文件中，cust_id，prod_id，价格，日期从file2放在新的csv文件中的结果，prod_id，prod_code，价格，数量从file3放在新的csv文件中的结果。代码： import pandas as pd customer_details = pd.read_csv("

浏览 19提问于2020-08-06得票数 0

1回答

如何停止networkx以更改源节点和目标节点？

、、

我用networkx从数据帧(巨大的网络)制作了一个图(而不是有向图)。我使用下面的代码来创建我的图形: nx.from_pandas_edgelist(R，source='A'，target='B'，create_using=nx.Graph()) 然而，在输出中，当我检查边缘列表时

浏览 27提问于2019-06-09得票数 1

2回答

Python Pandas* -处理CSV文件的文件夹并输出最终组合的CSV*

、

我正在尝试读取CSV文件的文件夹，逐个处理它们以删除重复项，然后将它们添加到主数据帧中，最后将其输出到CSV。我有这个..。import pandas as pdimport sys for root,

浏览 21提问于2020-08-24得票数 0

回答已采纳

2回答

字典中有分类ip地址的方法吗？

、、

我正在使用Pandas对数据帧进行排序。少数列是需要排序的IP地址。有没有一种方法可以方便地根据IP地址对Pandas进行排序？我可以用Pandas创建一个自定义函数来对IP地址进行排序吗？我能够对IP地址列表进行排序，但是我很难弄清楚如何使用Pandas创建自定义排序函数。有没有一种从套接字模块中合并inet_aton的方法？在Pandas之外的列表中，我完成

浏览 4提问于2019-07-12得票数 3

回答已采纳

1回答

根据每组值的分位数过滤数据帧

、、

假设我有一个这样的数据帧： import pandas as pd0 A 22 B 3 如何在pa

浏览 30提问于2020-01-31得票数 1

回答已采纳

2回答

如何从火花数据帧中创建边缘列表？

、、、、

我正在使用graphframes进行某些图形类型的分析，并想知道从顶点数据框架创建边缘列表数据帧的最佳方法是什么。|b |2 ||d |2 ||a |3 |+---+-----+ 我的目标是创建一个边缘</

浏览 9提问于2020-12-28得票数 3

回答已采纳

2回答

高效地添加到pandas数据帧

、、、

我看到dataframes有一个方法，但是返回一个新对象(与列表不同)。当我在添加行时，不断地为数据帧重新分配内存可能是低效的(另请参阅测试预分配空间以回复)。但我需要复制(然后修改)一些行，就像我在 (下面重复的示例)中描述的那样-将行附加到数据帧的末尾或以其他方式有效吗？

浏览 2提问于2015-09-24得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从pandas数据帧高效地创建边缘列表

相关·内容

从pandas数据帧高效地创建边缘列表

从pandas数据帧创建边缘列表非常慢

使用networkX创建图形

Pandas惯用的将json列表映射到dataframe的方式

从pandas数据帧生成边缘列表

如何从pandas数据帧创建多关系边缘列表？

将根据给定需求选择的某些行放入另一个数据帧中

从数据帧创建边缘列表

创建pandas数据帧:在numpy上映射函数

逐行高效地构建pandas数据帧

高效地将大型pandas数据帧转换为列表

从pandas* dataframe中选择特定行*

如何在pandas中向量化动态大小的numpy数组

使用pandas数据帧高效地搜索数据

如何停止networkx以更改源节点和目标节点？

Python Pandas* -处理CSV文件的文件夹并输出最终组合的CSV*

字典中有分类ip地址的方法吗？

根据每组值的分位数过滤数据帧

如何从火花数据帧中创建边缘列表？

高效地添加到pandas数据帧

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐