腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
将
pandas
数据
帧
列
划
分为
n
个
存储
桶
、
我有一
个
有7
列
的熊猫
数据
框架。对于这些
列
中的一
列
,我希望仅根据值将其内容划
分为
n
个
桶
。因此,如果我的
列
的值为1, 3, 5 ... (2*
n
+1),我
将
添加一
个
新的
列
,其中的
存储
桶
为1,2,3...
n
。此外,我也不希望在某种意义上标准化,即使我在这一
列
中有100
个</
浏览 2
提问于2017-02-22
得票数 1
回答已采纳
4
回答
有没有办法以编程方式检查程序的RAM使用率?
我写了一
个
程序,读取市场行情
数据
,并将
数据
拆
分为
10000
个
左右的小文件,每个符号一
个
文件。然而,它的速度太慢了,因为我有5年的
数据
要处理,按照这个速度,它将花费太长的时间。我一次有500
个
数据
流打开,我一次写一条消息(1到5行)的
数据
。我认为这就是瓶颈。我一次只能打开512
个
流,所以我必须运行20次左右的
数据
。因此,我的想法是
将
拆分的消息
存储
在
浏览 1
提问于2017-03-08
得票数 1
1
回答
忽略nans计算
pandas
数据
帧
列
的一部分的平均值
、
、
、
、
我在计算
pandas
数据
帧
中
列
的一部分的平均值时遇到问题。我需要将我的
数据
框分成子窗口,并且我需要每个较小窗口的平均值。我的代码如下所示: for x in np.array_split(array1, 10)]) 因此,目前我
将
array1
划
分为
10
个
子数组。现在我的问题是:出于某种原因,我
将
"nan“作
浏览 0
提问于2020-01-20
得票数 0
1
回答
根据字符数拆分Panda
列
、
、
、
我有一
个
pandas
数据
框架,其中包括下面的日期
列
,其中包含1000多个raw,格式如下: YearMonth Date:201801201910 我如何才能将2018年
划
分为
一
个
月和另一
个
列
浏览 10
提问于2019-03-06
得票数 0
回答已采纳
1
回答
在MarkLogic中为日期设置动态分
桶
约束
、
在我的
数据
库中,我在<date>上有一
个
包含xs:date的路径范围索引。<date>2019-01-01</date>2019 with quarter (2019 Q1 (Jan-Mar), Q2 (April-June) etc) 我的问题是,我希望动态更新
存储
桶
,以
将
当前年份计算到季度
存
浏览 0
提问于2019-07-10
得票数 0
4
回答
在
pandas
dataframe python中使用pii匿名特定
列
、
、
、
、
我已经加载了一
个
包含json文件的s3
存储
桶
,并将其解析/平整成一
个
pandas
数据
帧
。现在我有了一
个
175
列
的
数据
帧
,其中有4
列
包含个人身份信息。我正在寻找一
个
快速解决方案匿名这些
列
(名称和地址)。我需要保持信息的倍数,以便如果同一
个
人的姓名或地址出现多次具有相同的哈希。
pandas
或其他包中是否
浏览 4
提问于2017-12-28
得票数 7
1
回答
对32
个
随机元素列表进行排序的自适应排序算法与排序网络
、
、
、
、
对于
n
=32元素,还没有最优网络。实际上,如果我们要最小化CPU时钟周期的数目,那么最好将32
个
元素划
分为
n
=8的四
个
子列表,并在每个子列表上应用最优排序网络,然后
将
这些列表合并在一起吗?合并两个大小为
n
的列表: 合并两
个</
浏览 5
提问于2018-04-26
得票数 2
1
回答
关于任务并行化的问题
、
、
我有一
个
关于并行化的问题:(Option1)Should i
将
Dataset2
划
分为
x
个
分区,并将这些分区分配给Dataset1或(Option2)Should的x
个
工作线程数(这意味着与Datase
浏览 5
提问于2009-09-25
得票数 0
回答已采纳
1
回答
从多个S3
存储
桶
导入pyspark dataframe,其中有一
列
指示条目来自哪个
存储
桶
、
、
我有一
个
按日期分区的S3
存储
桶
列表。第一
个
存储
桶
标题为2019-12-1,第二
个
存储
桶
标题为2019-12-2,依此类推。这些
存储
桶
中的每一
个
都
存储
我正在读取到pyspark dataframe中的拼图文件。从每个
存储
桶
生成的pyspark dataframe具有完全相同的模式。我想要做的是迭代这些
存储
浏览 13
提问于2019-12-16
得票数 0
回答已采纳
2
回答
使用RDS时
pandas
.to_sql超时
、
、
、
我有一
个
2200万行的.csv文件(~850mb),我正试图将其加载到Amazon RDS上的postgres
数据
库中。它每次都会失败(我得到一
个
超时错误),即使当我
将
文件拆
分为
更小的部分(每个100,000行),甚至当我使用chunksize。我现在所做的就是
将
.csv作为
数据
帧
加载,然后使用df.to_sql(table_name, engine, index=False, if_exists='append', chunksi
浏览 1
提问于2015-05-17
得票数 6
2
回答
将
pandas
单元格中第
n
个字符位置附近的长字符串拆
分为
多个单元格,而不拆分单词
、
、
、
由于MS Excel
将
一
个
单元格中的字符数限制为32767
个
,因此我必须将
pandas
数据
帧
中的较长字符串拆
分为
几个单元格。有没有办法
将
pandas
列
"Text“的字符串拆
分为
多个
列
"Text_1”、"Text_2“、"Text_3”、……去分化?同样重要的是,文本块不能在单词内分隔,因此我假设需要使用正则表达式。15上,而不是在
n<
浏览 18
提问于2019-10-31
得票数 1
回答已采纳
1
回答
如何在不同的图形上绘制
Pandas
Dataframe
列
?
、
、
我正在尝试取一
个
有57
列
的
Pandas
数据
帧
,并将它们绘制在条形图上,每个图形有3
列
。原因是
数据
和
列
的长度的变化使得在许多曲线图中很难看到
数据
。不能在每个子图中绘制多个
列
,因此每个图必须在输出大小下可见。考虑到这些
数据
,我发现每个图有3
个
子图看起来最好。下面是我绘制
数据
帧
的脚本: fig, ax = plt.subplots(nrows=len(
浏览 0
提问于2020-02-28
得票数 0
1
回答
如何拆分举起
列
值和计数列表的
数据
帧
?
、
我有一
个
基于CSV的
数据
帧
name valueB 5D 1F 1 值计数字典如下所示: {5: 2,} 如何
将
原始
数据
帧
一
分为
二: name valueB 5C 5F 1 那么,如何拆分一
个
在
pandas</em
浏览 5
提问于2020-07-03
得票数 1
回答已采纳
2
回答
按字典顺序对字符串进行分组(python)
、
、
、
我有
N
个字符串,我想按字典顺序将它们分成M
个
偶数大小的
桶
(+/- 1
个
字符串)。还有,
N
>>M。有没有一种快速的pythonic方法
将
字符串分配给
存储
桶
?我本质上是在寻找一
浏览 2
提问于2012-02-12
得票数 1
回答已采纳
1
回答
带有条件变量的交叉表
我有以下
数据
帧
: set.seed(1) X = sample(c(0.1, 2.3, NA), 50, replace = TRUE), Y = sample
浏览 10
提问于2020-09-09
得票数 0
回答已采纳
3
回答
在
pandas
数据
帧
中将
列
拆分成多个不同长度的
列
、
、
我想根据长度
将
pandas
数据
帧
中的一
列
拆
分为
多个
列
。我有一
个
csv文件,它告诉我需要拆分多少列以及每
列
的长度。当我想做拆分时,我需要参考这个文件。- length为6 id name desc1 02 pears fruits 2 03 peach fruits 上面只是一
个
示例我怎样才能有一
个
通用的代码,可以在一
个</
浏览 77
提问于2021-08-15
得票数 0
1
回答
如何处理None类型,同时
将
Pandas
中的
列
拆
分为
两
列
、
、
如何处理None类型的,同时
将
Pandas
中的
列
拆
分为
两
列
None =空值 我必须用‘VIA’
将
列
‘技巧’
分为
'TECH_P
浏览 1
提问于2022-09-30
得票数 0
1
回答
使用pyspark
将
拼图文件(在亚马逊s3中)
存储
到spark
数据
框架中
、
、
、
、
我正在尝试从我的s3
存储
桶
中的特定文件夹读取
数据
。这些
数据
是拼图格式的。data这将返回一
个
pandas
2021-04-19 7100067787 BFDR -23.6077 -46.6617 2
浏览 9
提问于2021-06-10
得票数 0
回答已采纳
2
回答
拆分行并创建新
列
、
、
我有一
个
包含2447660行的
pandas
数据
帧
。我希望
将
行拆
分为
1564,并创建新的1564
列
。例如,假设我在一
个
数据
帧
中有10行,如下所示: Col1 -2.8343 -3.5910.9196 -2.4658
浏览 17
提问于2020-09-23
得票数 1
回答已采纳
1
回答
为每个连续
列
将
数据
帧
拆
分为
新
数据
帧
、
希望将此
数据
帧
的
列
拆
分为
多个
数据
帧
。每一
列
都有日期
列
和连续
列
。我如何得到一
个
函数,可以自动实现这一点。因此,我们将有
n
个
数据
帧
,
n
是原始
数据
帧
中的
列
数- 1(日期
列
)。
浏览 1
提问于2022-08-24
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
将多个Excel工作表合并到一个Pandas数据帧中
pandas系列学习(五):数据连接
如何只用一行代码让 Pandas 加速四倍?
划重点!12种高效Numpy&Pandas使用技巧!
如何只用一行代码让Pandas加速四倍?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券