在我的例子中，迭代Pandas行的最佳方式是什么？

文章/答案/技术大牛

发布

4回答

、、、、

我有一个关于Pandas行的迭代的复杂性问题。我有一个超过30k行的数据集，我需要为每个数据集添加一个新列，其中包含来自特定列的值。df_user_hashtag['p'][i] = 3 * df_user_hashtag['num_followers'][i]\df_user_hashtag['sentiment_compound'][i

浏览 61提问于2021-10-31得票数 0

回答已采纳

1回答

将大型json文件读入pandas dataframe

、、

我有一个很大的JSONL文件(大约100 GB)。我想将其转换为pandas数据帧，并通过迭代所有行对列应用一些函数。阅读这个JSONL文件的最佳方式是什么？我目前正在做以下工作，但它被卡住了(在GCP上运行此程序) import pandas as pddata = [] with open("my_jsonl_file&q

浏览 9提问于2020-03-17得票数 0

回答已采纳

2回答

根据长度将数据帧拆分成相对均匀的块

、

我必须创建一个函数，该函数将所提供的数据帧分割成所需大小的块。例如，如果dataframe包含1111行，我希望能够指定400行的块大小，并获得三个较小的dataframe，大小分别为400、400和311。有没有方便的函数来做这项工作？存储和迭代切片数据帧的最佳方式是什么？示例DataFrameimpor

浏览 0提问于2015-10-27得票数 35

回答已采纳

1回答

itertuples中返回值的类型，打印pandas中itertuple的列名

、

我有一个如下的DataFrame：0 0.140603 0.622511 0.936006 0.3842741 0.246792 0.961605 0.866785 0.544677我想用itertuples()迭代df，并打印每一行的值和列名。, d=0.029942550647279687) 问题：

浏览 2提问于2017-08-16得票数 1

回答已采纳

1回答

我如何操作通过itertuples产生的命名元组，特别是删除一个元素并从剩余元素中产生一个字典？

、、、、

这个问题最好用一个例子来展开： import pandas as pddf = pd.DataFrame(np.random.randn但是，当切换到迭代组时，我不确定如何操作pandas.core.frame.Pandas对象，即以类似的方式为每一行生成的pandas.core.series.Series命名元组，以实现与操作iterro

浏览 11提问于2021-04-02得票数 0

回答已采纳

2回答

用于csv文件/数据帧的Postgresql批插入(在GCP上)

、、、、

我有一个包含两列[key, chunk]的csv文件，需要将其插入到SQL db表中。(放大信息-托管在GCP上的Postgresql数据库，我可以很好地选择和执行其他数据库操作。)我的csv文件有1000多万行。因此，我很好奇，针对Postgresql语法，我可以使用的最佳批处理插入选项是什么？将csv文件作为pandas数据

浏览 2提问于2021-05-28得票数 0

1回答

迭代LibGit2Sharp中的差异更改

、、、

在上使用LibGit2Sharp迭代的最佳方法是什么(如在性能方面，简单的)？更新：假设我想构建我自

浏览 2提问于2012-06-08得票数 1

2回答

Pandas中的逐行平均差

、

给定一个pandas数据帧，最有效的方式是做滚动平均值的行差分。： np.random.seed(43)0 4 0 1 52 7 0 3 24 3 5 4 4 5 0

浏览 44提问于2021-01-29得票数 1

回答已采纳

2回答

R中的复制和迭代

、、

这一行代码rep(c(0), 2)创建1 0我想以一种适合R的方式来扩展它，这样我就得到了类似下面的向量。基本上，我想将整数作为这样的两两附加：1 03 15 2我觉得这是R不喜欢循环的一个例子，它有一个意想不到的副作用，使简单的事情看起来不熟悉，让我渴望其他语言中

浏览 4提问于2014-02-18得票数 2

回答已采纳

3回答

Pandas中基于行值的数据比较

、、、、

在数据之间没有1:1基数的情况下，使用Pandas比较两个数据集(.csv文件)的最佳方法是什么？举个例子:这是数据集1的一个样本-01 Shirt Red $30一份数据收集的样本-01 Trouser Black $2003 Hat Blue $10 04 Shirt R

浏览 0提问于2018-11-20得票数 0

2回答

如何有效地从一个大的excel文件中读取数据，进行计算，然后将结果存储回python？

、、、、

假设我有一个100k行的excel文件。我的代码正在尝试逐行读取它，并对每行进行计算(包括执行每行所需时间的基准测试)。然后，我的代码将生成一个包含100k行的结果数组。我的代码保存了results=[]，并且只在末尾编写它。另外，在开始时，我将整个excel文件存储在worksheet中。<

浏览 24提问于2019-04-26得票数 0

9回答

迭代Python列表的起始索引

、

在Python中迭代列表时，设置起始索引的最佳方式是什么？例如，我列出了一周中的几天--星期天、星期一、星期二……星期六-但是我想从星期一开始迭代这个列表。执行此操作的最佳实践是什么？

浏览 5提问于2011-05-27得票数 99

回答已采纳

1回答

比较父列表结构中的嵌套列表以查找java中特定索引中的值。

、、、、

给定以下格式的列表列表：迭代每个列表，查找与列表中1和2的任何其他行的值匹配的和索引值的重复值的最佳方式是什么因此，如果存在帐户id和员工id都重复的行，则可以执行操作吗？

浏览 1提问于2019-08-15得票数 0

1回答

动态地在多个IEnumerables上迭代(Linq？)

、

一次在多个IEnumerables上动态迭代的最佳方法是什么？列表是以一种复杂的方式嵌套的。它不是一个简单的List<List<Entity>>Dictionary<int, List<Entity>[]> submeshes = new Dictionary<int, Listforeach(Entity e in subm

浏览 3提问于2020-01-09得票数 0

回答已采纳

1回答

用Python和Pandas进行最有效的后处理

、、

这个问题是关于在Pandas数据仓库中工作的最佳实践。速度、易用性和内存消耗都可能影响到您可能得到的任何答案。对于这个例子，让我们使用两种状态，SD和ND。位置1,2,4在ND，3在SD。在我看来，我有两个选择：让Pandas后处理位置号码。构建一个查找表，并让Pandas将状态附加到dataframe中的每一行。然后按状态对

浏览 0提问于2018-03-06得票数 1

回答已采纳

1回答

在QT中本地化上下文菜单？

、、、、

在Qt中本地化默认上下文菜单的最佳方式是什么？一个例子是右键单击QPlainTextEdit时弹出的上下文菜单。这需要在PC和Mac上运行。我知道可以迭代自定义菜单中的每个菜单项，并将翻译应用到每个菜单项，但我希望有更自动的东西，最好是拉入操作系统原生翻译的上下文菜单。

浏览 2提问于2011-03-17得票数 2

1回答

如何在熊猫数据框架的某些列上进行迭代？

、

我有一个熊猫数据中心data，有27栏。我需要迭代其中的6列。对于每一次迭代，我只是简单地打印出元素，这样数据就不会发生变异。注意，每一行的打印方式都是专门化的，我不能同时打印所有行。我想知道做这件事的最佳方法是什么？

浏览 4提问于2022-11-29得票数 0

4回答

从Pandas DataFrame绘图时注记数据点

、

我想用图上点旁边的数据点的值来注释这些数据点。我找到的例子只处理x和y作为向量。但是，我想对包含多个列的pandas DataFrame执行此操作。ax = plt.figure().add_subplot(1, 1, 1)plt.show() 注释多列DataFrame的所有点的最佳方式是什么？

浏览 1提问于2013-04-10得票数 41

回答已采纳

1回答

从csv文件读取到循环并插入到mysql数据库

、

我在一个系统上工作，可以发送个性化的消息给客户。我有一个包含联系人和姓名的文件。我想上传文件，然后读取文件。在插入到数据库之前，我想从html模板中的文本框添加一条消息到数据库中。例如，我会说:亲爱的名字，谢谢你。它将循环通过excel文件，并插入到数据库中的联系人和消息，已生成像亲爱的罗纳德，谢谢。我已经设

浏览 0提问于2019-06-04得票数 0

1回答