腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
除了
计算
之外
,
使用
现有
数据
帧
选择
性地
构建
新
的
数据
帧
、
、
、
、
填写下面的Pandas代码,创建一个
新
的
名称为customer_spend
的
DataFrame,它包含以下列
的
顺序: customer_id、name和total_spend。total_spend是一个
新
列,其中包含特定客户下
的
所有订单
的
成本总和。 我正在做一个与Python Pandas相关
的
在线课程。正如我在上面所写
的
,这段代码
的
目标是创建一个名为'customer_spend‘
的
<
浏览 6
提问于2019-01-07
得票数 2
回答已采纳
1
回答
是否有任何明确
的
保证dplyr操作保持行顺序?
、
、
当我教人们如何
使用
dplyr时,我警告他们不要假设任何dplyr函数都将保持
数据
的
顺序,除非文档中另有说明。但是,我没有找到任何关于这个问题
的
正式文档,这使得我更难说服人们,他们应该更加小心地假设他们
的
代码在做什么。例如,显式地保证行数将被保留,但没有提到任何关于顺序保存
的
内容。是否有任何与dplyr (或tidyverse)相关
的
官方语句或文档,如果有的话,可以假设在我可以指向
的
函数中保留行顺序?
浏览 2
提问于2020-02-11
得票数 6
1
回答
是否将pandas
数据
框导出到excel仅导出最后一行?
、
、
、
您好,我是Python
的
新手,我正在编写一个脚本,用于提取Twitter API
数据
并将其导出到Excel。我可以将所有的tweet和发布日期
的
数据
放到我
的
数据
框中(即,与我在count参数中放入
的
tweet一样多),但是当我尝试导出pandas
数据
框以超越
数据
框时,是否只存在tweet
数据
的
最后一行?非常感谢你
的
帮助,我已经写了下面的代码,如果你知道该怎么做,请让我知道我应该如何
浏览 0
提问于2021-06-14
得票数 0
1
回答
动态地改变内存中
的
groupby对象而不重建它
、
、
为石斑鱼熊猫添加
新
的
索引。假设我有一个由id索引
的
列为df1,df2,..dfn
的
其他
数据
帧
的
集合。 假设命令keys=[df1,..,dfn]和grouper=df.groupby(keys)需要几秒钟才能运行(因为我
的
数据
帧
非常大)。我想要将
新
行添加到我
的
数据
帧
df中,这
浏览 0
提问于2014-12-05
得票数 0
1
回答
如何从
现有
pandas
数据
帧
的
子集创建pandas
数据
帧
、
、
我有一个
现有
的NBA球员在2020-2021赛季
的
数据
框架。我还有一份今年入选NBA全明星赛
的
球员名单。我想迭代我
的
现有
数据
帧
,并创建一个
新
的
数据
帧
,其中只包含那些在我
的
全明星球员名单中
的
球员
的
统计
数据
。为了澄清,我希望我
的
新
数据
帧
看起来与
浏览 0
提问于2021-03-04
得票数 0
1
回答
Spark performance -如何并行化大型循环?
、
、
、
我有一个总共包含8000个循环
的
Spark应用程序,它在5个节点
的
集群上运行。每个节点具有125 32内存和32个核心。关注
的
代码如下所示: var id = deviceArray(m)每个循环大约需要50秒才能
使用
完集群。我
的
数据
大小是2到3 GB (从表中读取)。如果有8000个循环,运行这个Spark应用程序
的</e
浏览 2
提问于2015-12-08
得票数 2
1
回答
如何
使用
pandasGUI实时刷新
数据
帧
(不
使用
'remove‘和'add’功能)
、
、
、
、
我基本上是每5秒从PostgreSQL导入一个表,并将其刷新到一个
数据
帧
中,
除了
列
之外
,每次
的
数据
帧
都是不同
的
。现在,我只是通过删除旧
的
数据
帧
,然后
使用
pandasGUI中
的
函数"store.add_dataframe“和"store.remove_dataframe”添加一个
新
的
数据
<em
浏览 0
提问于2021-02-18
得票数 0
2
回答
Cumsum作为
现有
Pandas
数据
中
的
新
列
、
、
、
我有一个pandas
数据
帧
定义为:1 1 10 我想
计算
SUM_C
的
累积和,并将其作为
新
列添加到相同
的
数据
帧
中。换句话说,我
的
最终目标是拥有一个如下所示
的
数据
帧
:1 1 10 10 1 2 20
浏览 11
提问于2017-01-26
得票数 31
回答已采纳
1
回答
数据
框列
的
选择
性移位
、
、
我有一个包含多个列
的
dataframe,并且希望有
选择
地将除一列(名为target)
之外
的
所有列延迟指定
的
步数。
浏览 1
提问于2018-09-25
得票数 0
1
回答
如何将行名提取为变量,以便将其应用于另一个
数据
帧
、
我是R
的
新手。我目前正在处理两个
数据
帧
,一个包含初始值,另一个包含
使用
原始
数据
计算
得出
的
值。我
的
计算
值
的
新
数据
帧
是这样
构建
的
: reldf <- data.frame(matrix(ncol = 13, nrow = nrow(glasgow2001))) names <- c("2001r"20
浏览 23
提问于2019-07-03
得票数 0
2
回答
Pandas:基于
现有
数据
帧
创建
新
的
数据
帧
、
、
从
现有
数据
框创建
新
数据
框最优雅
的
方法是: 1.只
选择
某些列,2.同时重命名它们?例如,我有以下
数据
帧
,其中我希望
选择
列B、D和F,并将它们重命名为X、Y、ZA B C D E F1 2 3 4 5 6X Y Z2 4
浏览 34
提问于2019-03-13
得票数 -1
1
回答
连接两个相同
的
数据
帧
并只保留
新
条目
、
我有两个
数据
帧
,
除了
额外
的
一到两行
之外
,它们是完全相同
的
。如何将它们连接到一个
数据
帧
中,而只将
新
条目添加到原始
数据
帧
中?我尝试过
使用
pandas来做这件事,但我只能将它们连接在一起,我想不出一种只保留
新
条目并将它们添加到原始条目上
的
方法。 会很感谢你
的
帮助。
浏览 5
提问于2020-08-28
得票数 0
2
回答
重新评估Pandas列中
的
数据
类型
、
我有一个像这样
的
数据
帧
0 2 46 59 40 53 17显然,
数据
类型都是对象0 object2 object4 object我
使用
代码df2 = df.iloc[1:,:]从第一个
数据
帧
生成一个
新<
浏览 11
提问于2019-11-14
得票数 0
2
回答
使用
Dask导入大型CSV文件
、
、
、
、
我正在
使用
Dask导入一个非常大
的
csv文件,大约680 am,然而,输出并不是我所期望
的
。我
的
目标是只
选择
一些列(6/50),并可能过滤它们(这一点我不确定,因为似乎没有
数据
?)
浏览 6
提问于2021-07-03
得票数 3
2
回答
一条现代图形管道有多少
帧
深?
、
、
、
、
有多少
帧
的
数据
在(现代
的
)管道中? CPU驱动程序命令缓冲区中
的
帧
浏览 4
提问于2016-12-12
得票数 3
回答已采纳
1
回答
通过在不同线程中执行多个查询来触发
数据
帧
缓存
、
我想知道spark中
的
数据
帧
缓存是否是线程安全
的
。在我们
的
一个用例中,我从一个hive-table创建一个dataframe,然后通过不同
的
线程在同一个dataframe上运行多个SQL。由于我们
的
存储和
计算
是解耦
的
,而且由于某些原因读取非常慢,我在考虑将
数据
帧
缓存到内存中,并将缓存
的
数据
帧
用于所有查询。
数据
帧
浏览 17
提问于2020-03-10
得票数 0
1
回答
向R dataframe添加
新
行-但如果不存在呢?
、
是否有可能添加
数据
帧
中已不存在
的
新
行?我用变量
的
不同组合(随机
选择
)创建了一个大
的
数据
帧
(100k条记录),我想用一个条件将它们添加到
现有
的
数据
帧
中:它们必须是不同
的
(至少一个变量必须不同)。
浏览 2
提问于2016-06-15
得票数 4
1
回答
流处理架构:未来事件影响过去
的
结果
、
、
、
我们依赖于Kafka来获取我们
的
pubsub/
数据
,但是在流处理器框架/方法方面没有特别的附件。 理论上,假设我有一个零星地发出浮点值
的
源。然后,我很想
使用
一个标准
的
流处理框架来创建一个输出主题,比如"Results",该框架将两个流连接在一起,并且仅将每个值与乘数确定的当前乘数相乘。从概念上讲,我希望有一个类似于结果流
的
东西,它在最后一个事件中是当前
的
,并根据值中
的
所有值发送到乘数,但可以随着进一步
的<
浏览 7
提问于2017-07-31
得票数 2
回答已采纳
1
回答
检查模拟方法
的
类对象
、
、
我正在编写一个函数
的
测试,该函数
使用
数据
帧
的
to_sql()方法将熊猫
数据
帧
发送到sql
数据
库。为了避免实际发送任何内容,我
使用
mock.patch('pandas.DataFrame.to_sql')模拟该方法。 我想查看调用to_sql()时
数据
帧
的
状态。有没有办法
使用
mock来做到这一点?也就是说,它是否知道被模拟函数是从哪个对象调用<e
浏览 2
提问于2019-03-22
得票数 0
1
回答
在Python中
使用
Pandas将
选择
性
数据
值作为浮点数写入csv/txt文件
、
、
、
使用
这个平台
的
互联网信息/信息,我设法写了一个小
的
Python代码,它读取200CSV,然后能够区分对应于列
的
索引
的
不同值。
使用
下面的Python脚本,我可以编写一个变量"time": # importing different modulesimport numpy as np tfile = open('test.txt', 'a'
浏览 40
提问于2021-04-07
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券