除了计算之外，使用现有数据帧选择性地构建新的数据帧

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

2回答

、、、、

填写下面的Pandas代码，创建一个新的名称为customer_spend的DataFrame，它包含以下列的顺序: customer_id、name和total_spend。total_spend是一个新列，其中包含特定客户下的所有订单的成本总和。我正在做一个与Python Pandas相关的在线课程。正如我在上面所写的，这段代码的目标是创建一个名为'customer_spend‘的<

浏览 6提问于2019-01-07得票数 2

回答已采纳

1回答

当我教人们如何使用dplyr时，我警告他们不要假设任何dplyr函数都将保持数据的顺序，除非文档中另有说明。但是，我没有找到任何关于这个问题的正式文档，这使得我更难说服人们，他们应该更加小心地假设他们的代码在做什么。例如，显式地保证行数将被保留，但没有提到任何关于顺序保存的内容。是否有任何与dplyr (或tidyverse)相关的官方语句或文档，如果有的话，可以假设在我可以指向的函数中保留行顺序？

浏览 2提问于2020-02-11得票数 6

1回答

是否将pandas数据框导出到excel仅导出最后一行？

、、、

您好，我是Python的新手，我正在编写一个脚本，用于提取Twitter API数据并将其导出到Excel。我可以将所有的tweet和发布日期的数据放到我的数据框中(即，与我在count参数中放入的tweet一样多)，但是当我尝试导出pandas数据框以超越数据框时，是否只存在tweet数据的最后一行？非常感谢你的帮助，我已经写了下面的代码，如果你知道该怎么做，请让我知道我应该如何

浏览 0提问于2021-06-14得票数 0

1回答

动态地改变内存中的groupby对象而不重建它

、、

为石斑鱼熊猫添加新的索引。假设我有一个由id索引的列为df1,df2,..dfn的其他数据帧的集合。假设命令keys=[df1,..,dfn]和grouper=df.groupby(keys)需要几秒钟才能运行(因为我的数据帧非常大)。我想要将新行添加到我的数据帧df中，这

浏览 0提问于2014-12-05得票数 0

1回答

如何从现有pandas数据帧的子集创建pandas数据帧

、、

我有一个现有的NBA球员在2020-2021赛季的数据框架。我还有一份今年入选NBA全明星赛的球员名单。我想迭代我的现有数据帧，并创建一个新的数据帧，其中只包含那些在我的全明星球员名单中的球员的统计数据。为了澄清，我希望我的新数据帧看起来与

浏览 0提问于2021-03-04得票数 0

1回答

Spark performance -如何并行化大型循环？

、、、

我有一个总共包含8000个循环的Spark应用程序，它在5个节点的集群上运行。每个节点具有125 32内存和32个核心。关注的代码如下所示： var id = deviceArray(m)每个循环大约需要50秒才能使用完集群。我的数据大小是2到3 GB (从表中读取)。如果有8000个循环，运行这个Spark应用程序的</e

浏览 2提问于2015-12-08得票数 2

1回答

如何使用pandasGUI实时刷新数据帧(不使用'remove‘和'add’功能)

、、、、

我基本上是每5秒从PostgreSQL导入一个表，并将其刷新到一个数据帧中，除了列之外，每次的数据帧都是不同的。现在，我只是通过删除旧的数据帧，然后使用pandasGUI中的函数"store.add_dataframe“和"store.remove_dataframe”添加一个新的数据<em

浏览 0提问于2021-02-18得票数 0

2回答

Cumsum作为现有Pandas数据中的新列

、、、

我有一个pandas数据帧定义为：1 1 10 我想计算SUM_C的累积和，并将其作为新列添加到相同的数据帧中。换句话说，我的最终目标是拥有一个如下所示的数据帧：1 1 10 10 1 2 20

浏览 11提问于2017-01-26得票数 31

回答已采纳

1回答

数据框列的选择性移位

、、

我有一个包含多个列的dataframe，并且希望有选择地将除一列(名为target)之外的所有列延迟指定的步数。

浏览 1提问于2018-09-25得票数 0

1回答

如何将行名提取为变量，以便将其应用于另一个数据帧

、

我是R的新手。我目前正在处理两个数据帧，一个包含初始值，另一个包含使用原始数据计算得出的值。我的计算值的新数据帧是这样构建的： reldf <- data.frame(matrix(ncol = 13, nrow = nrow(glasgow2001))) names <- c("2001r"20

浏览 23提问于2019-07-03得票数 0

2回答

Pandas:基于现有数据帧创建新的数据帧

、、

从现有数据框创建新数据框最优雅的方法是: 1.只选择某些列，2.同时重命名它们？例如，我有以下数据帧，其中我希望选择列B、D和F，并将它们重命名为X、Y、ZA B C D E F1 2 3 4 5 6X Y Z2 4

浏览 34提问于2019-03-13得票数 -1

1回答

连接两个相同的数据帧并只保留新条目

、

我有两个数据帧，除了额外的一到两行之外，它们是完全相同的。如何将它们连接到一个数据帧中，而只将新条目添加到原始数据帧中？我尝试过使用pandas来做这件事，但我只能将它们连接在一起，我想不出一种只保留新条目并将它们添加到原始条目上的方法。会很感谢你的帮助。

浏览 5提问于2020-08-28得票数 0

2回答

重新评估Pandas列中的数据类型

、

我有一个像这样的数据帧0 2 46 59 40 53 17显然，数据类型都是对象0 object2 object4 object我使用代码df2 = df.iloc[1:,:]从第一个数据帧生成一个新<

浏览 11提问于2019-11-14得票数 0

2回答

使用Dask导入大型CSV文件

、、、、

我正在使用Dask导入一个非常大的csv文件，大约680 am，然而，输出并不是我所期望的。我的目标是只选择一些列(6/50)，并可能过滤它们(这一点我不确定，因为似乎没有数据？)

浏览 6提问于2021-07-03得票数 3

2回答

一条现代图形管道有多少帧深？

、、、、

有多少帧的数据在(现代的)管道中？ CPU驱动程序命令缓冲区中的帧

浏览 4提问于2016-12-12得票数 3

回答已采纳

1回答

通过在不同线程中执行多个查询来触发数据帧缓存

、

我想知道spark中的数据帧缓存是否是线程安全的。在我们的一个用例中，我从一个hive-table创建一个dataframe，然后通过不同的线程在同一个dataframe上运行多个SQL。由于我们的存储和计算是解耦的，而且由于某些原因读取非常慢，我在考虑将数据帧缓存到内存中，并将缓存的数据帧用于所有查询。数据帧

浏览 17提问于2020-03-10得票数 0

1回答

向R dataframe添加新行-但如果不存在呢？

、

是否有可能添加数据帧中已不存在的新行？我用变量的不同组合(随机选择)创建了一个大的数据帧(100k条记录)，我想用一个条件将它们添加到现有的数据帧中:它们必须是不同的(至少一个变量必须不同)。

浏览 2提问于2016-06-15得票数 4

1回答

流处理架构:未来事件影响过去的结果

、、、

我们依赖于Kafka来获取我们的pubsub/数据，但是在流处理器框架/方法方面没有特别的附件。理论上，假设我有一个零星地发出浮点值的源。然后，我很想使用一个标准的流处理框架来创建一个输出主题，比如"Results"，该框架将两个流连接在一起，并且仅将每个值与乘数确定的当前乘数相乘。从概念上讲，我希望有一个类似于结果流的东西，它在最后一个事件中是当前的，并根据值中的所有值发送到乘数，但可以随着进一步的<

浏览 7提问于2017-07-31得票数 2

回答已采纳

1回答

检查模拟方法的类对象

、、

我正在编写一个函数的测试，该函数使用数据帧的to_sql()方法将熊猫数据帧发送到sql数据库。为了避免实际发送任何内容，我使用mock.patch('pandas.DataFrame.to_sql')模拟该方法。我想查看调用to_sql()时数据帧的状态。有没有办法使用mock来做到这一点？也就是说，它是否知道被模拟函数是从哪个对象调用<e

浏览 2提问于2019-03-22得票数 0

1回答

在Python中使用Pandas将选择性数据值作为浮点数写入csv/txt文件

、、、

使用这个平台的互联网信息/信息，我设法写了一个小的Python代码，它读取200CSV，然后能够区分对应于列的索引的不同值。使用下面的Python脚本，我可以编写一个变量"time"： # importing different modulesimport numpy as np tfile = open('test.txt', 'a'

浏览 40提问于2021-04-07得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云