腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
创建
子
数据
帧
列表
的
最快
方法
python
、
pandas
我有大量
的
数据
。 它包含10年
的
日期变量(大约3650天),每天有超过10,000次观测。 因此,总行数为36,500,000。我
的
目标是将多个(大约3650个)
子
数据
帧
按日期分组,并将其放入单个
列表
中。 我使用
的
方式是for-loop,这需要花费很多时间。 实际上,在我
的
电脑规格下,完成这项工作需要大约1个小时。我想找到
创建
多个子
数据
帧
的
最佳(
浏览 21
提问于2020-07-17
得票数 0
回答已采纳
3
回答
如何使用缺失值填充
数据
帧
列表
python
、
pandas
我有一个包含以下内容
的
数据
帧
: colA colBGHI 0.01 和我想要为其
创建
数据
帧
的
唯一
列表
: ABCGHI 我需要
创建
的
数据
帧
应该是: colAcolBDEF 0.00 GHI 0.01 填充我
的
新
数据
帧
的
最快</e
浏览 36
提问于2020-10-21
得票数 0
回答已采纳
2
回答
Pyspark替换Spark dataframe列中
的
字符串
python
、
apache-spark
、
pyspark
我想通过替换
子
字符串在Spark Dataframe列上执行一些基本
的
词干提取。做这件事
最快
的
方法
是什么?id address2 10 bar lane会变成 id address
浏览 0
提问于2016-05-05
得票数 54
回答已采纳
1
回答
R将httr GET响应解析为单个
数据
帧
r
、
json
、
data.table
、
httr
我在解析来自GET命令
的
响应时遇到了问题。我们
的
目标是获得一个
数据
框,其中
的
每一列都对应于返回
的
每一列。生成响应
的
代码如下所示,只是缺少wosliteKey
的
值。RDS格式
的
响应
数据
是here。我使用以下两个命令将响应转换为json类型文件 jsonRespText <- content(response, "text") j <- fromJSON(jsonRespText) 这会产生一个包含一
浏览 21
提问于2019-05-12
得票数 1
1
回答
将
数据
帧
列表
另存为python中
的
文件
python
、
dataframe
、
save
假设list_dfs是许多
数据
帧
的
列表
。将此
列表
作为文件保存在存储设备上并再次读取它
的
最快
方法
是什么?
浏览 0
提问于2019-09-27
得票数 0
1
回答
python通过
列表
创建
具有一行
的
数据
框
python
、
list
、
pandas
、
dataframe
在python中,假设我有一个
列表
1,2,3,...,100,我想使用这个
列表
来
创建
一个
数据
帧
,它有一行,行值是
列表
。
最快
、最优雅
的
方式是什么?
浏览 0
提问于2015-03-16
得票数 16
回答已采纳
1
回答
有没有一种通过
列表
理解来迭代两个
数据
帧
的
更快
方法
?
pandas
、
dataframe
、
list-comprehension
我有两个
数据
帧
,一个包含屏幕名称/显示名称,另一个包含个人,我正在尝试
创建
第三个
数据
帧
,每次屏幕名称/显示名称中出现姓氏时,在新行中包含来自每个
数据
帧
的
所有
数据
。从功能上讲,这将
创建
一个可能匹配
的
名称
列表
。我当前
的
代码运行得很好,但运行速度非常慢,如下所示:# cols
浏览 0
提问于2016-04-11
得票数 1
1
回答
行绑定
列表
中包含
的
多个
数据
帧
r
有没有一种
方法
可以用很少
的
代码行绑定
列表
中包含
的
多个
数据
帧
并最大限度地减少内存使用? super_list包含20个
子
列表
,每个
列表
包含100个
数据
帧
。我想
创建
100个
数据
帧
,每个都是由行绑定20个
数据
帧
组成,每个
数据
帧
来自super_list
的
每个子<em
浏览 7
提问于2019-06-28
得票数 1
1
回答
向从
列表
构建
的
熊猫
数据
框添加行
的
最快
方法
是什么?
python
、
pandas
、
dataframe
、
optimization
、
list-comprehension
我正在尝试
创建
twitter
数据
的
数据
框架。使用twitter API,我有一个作为
列表
(tweets)
的
twitter对象
列表
,并希望使用来自这些twitter对象
的
各种信息填充一个
数据
帧
,并对文本使用一些其他函数。我当前
的
方法
对每个列使用
列表
理解,每次迭代所有tweet。当我增加tweet
的
数量时,速度变得非常慢。 我还研究了另外两种
浏览 10
提问于2021-02-05
得票数 1
1
回答
在大
列表
中查找重复
子
列表
python
、
list
、
sequence
、
repeat
、
sublist
我有一个很大
的
子
列表
(大约)。16000),我想知道重复模式从哪里开始和结束。我不是100%肯定有重复,但我有很强
的
理由相信,由于对角线出现在
子
列表
序列中。
子
列表
的
结构是首选
的
,因为它被用于本脚本中
的
其他内容。', etc 我没有任何时间限制,但
最快
的
方法
是不会皱眉
的
。代码应该能够返回
列表
中
的
浏览 5
提问于2016-07-19
得票数 0
2
回答
pandas Dataframe中
列表
上
的
“'Where子句”
python
、
pandas
、
dataframe
我有一个名为df
的
熊猫
数据
帧
:___________________________email1email.com | [2,1]email1@email.com | [0,0]我想从df中检索具有0
列表
的
所有行
浏览 3
提问于2014-09-30
得票数 3
回答已采纳
1
回答
如何拆分已拆分
的
数据
文件名并保存在R中
的
多个文件夹中
r
我已经将我
的
数据
框架分割成100个
数据
框架,如下所示。每个tibble中有10个变量,包括class_name。
创建
一个名为每个tibble
的
文件夹,并将每个tibble重新拆分为class_names并保存为分离
的
CSV
的
最佳
方法
是什么。我已经尝试过几个lapply
的
组合(finction(X),paste0()),但是失败了。因此,假设拆分
的
数据
文件是这样
的
: MyDF
浏览 1
提问于2019-10-22
得票数 0
回答已采纳
1
回答
如果你对寻找哪个子字符串有限制,你能在比O(N^2)更快
的
时间内找到一个字符串
的
所有
子
字符串吗?
algorithm
、
recursion
、
substring
、
big-o
、
trie
查找字符串
的
所有可能
子
字符串
的
最快
方法
是O(N^2)。但是,如果我们假设我有一个单词
列表
,而我不想看某个字符串x是否包含该单词
列表
中
的
子
字符串,那么这是否仍然是正确
的
。例如,如果要
创建
一个单词
列表
,允许我最好地忽略某些
子
字符串。从而使运行时间更好?
浏览 2
提问于2022-01-25
得票数 0
回答已采纳
2
回答
在nodejs中,在数组中查找
子
数组
node.js
、
arrays
有
最快
的
方法
在数组中找到
子
数组吗?以匿名
方法
为例? break; } return pos;诚挚
的</
浏览 4
提问于2021-09-26
得票数 0
回答已采纳
2
回答
查询
数据
帧
的
最快
方法
python
、
pandas
我想对大熊猫
数据
帧
(数百万行)
的
行进行聚合操作(sum),这是由几个固定列(最多10列)上
的
一个条件决定
的
。这些列只有整数值。 我
的
问题是我必须进行这个操作(查询+聚合)数千次(~100000次)。我认为对于聚合部分,没有太多需要优化
的
地方,因为它只是一个简单
的
求和。执行此任务
的
最有效
方法
是什么?有没有什么
方法
可以在我
的
条件列上建立一个“索引”,以加快每个查询
的
速
浏览 0
提问于2013-12-19
得票数 10
3
回答
将python迭代器输出转换为pandas
数据
帧
的
最快
方法
python
、
pandas
我有一个生成器,它返回未知数量
的
数据
行,我希望将这些
数据
转换为索引
的
pandas
数据
帧
。据我所知,
最快
的
方法
是将CSV写入磁盘,然后通过'read_csv‘解析回来。我知道
创建
一个空
的
dataframe,然后不断地追加新
的
行是没有效率
的
。我不能
创建
预置大小
的
dataframe,因为我不知道将返回多少行。有没有一种<em
浏览 1
提问于2017-03-24
得票数 12
1
回答
检查pandas
数据
帧
并在同一行
的
其他列中显示其他元素
的
最快
方法
python
、
pandas
、
dataframe
如果有需要检查
的
单词
列表
... word_list = ['word1', 'word2', 'word3'] 和像这样
的
数据
帧
Word,Score_a,Score_b,Score_cword3,40,20,10 在给定
的
单词
列表
中找到每个单词
的
相应分数
的
最快
方法
是什么?例如,&
浏览 11
提问于2021-03-21
得票数 2
回答已采纳
1
回答
如何从子
列表
中
的
所有
数据
框中提取一列,并使用这些
数据
运行Kruskal Wallis测试?
r
当我这样做
的
时候:我能够对子
列表
中每个
数据
帧
的
第14列运行测试。然而,我需要在超过1000个
子
列表
上运行它,所以单独写出来是不可行
的
。如何访问每个子
列表
中每个
数据
帧
的
第14列,以便仅对该
子
列表
中
的
数据</em
浏览 0
提问于2017-07-29
得票数 1
1
回答
如何使用循环从一个矩阵中获得多个条件下
的
多个子集?
r
我想问一个R
的
数据
操作问题。)], 2, function(i) (sum(i > 0)))G2<-(sig2*sh2) G<-data.frame(G1/G2) 我想设置一个R代码,根据上面提到
的
每个条件,为all_matrix
的
所有子集计算"G“。那么,我如何使用loop对每个子集使用不同
的
条件来获得矩阵
的
子集,以便进一步处理以计算"G": 我想在循环中使用subset()函数: 有人能帮
浏览 21
提问于2018-12-20
得票数 0
1
回答
提高非常大
的
数据
帧
上
的
迭代性能
python
、
pandas
、
dataframe
、
iteration
、
list-comprehension
我有一个pandas
数据
帧
,它由300万行和50列组成,所有列都包含整数(正数或负数)。我想
创建
一个名为'feature‘
的
新列,它从现有的50列中提取最大
的
负数。因为我
的
数据
帧
太大了,所以我尝试
的
解决方案花费
的
时间太长了。例如,我尝试过使用
列表
理解,但是因为我求助于iterrows(),所以它太慢了(itertuples()
的
性能并没有明显
的
提高):
浏览 3
提问于2019-07-17
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
word 2007创建子宏的方法
Python 二维列表大小查看方法详解:探索多维数据结构的维度与规模
python基础必知必会:将字符串、列表等数据保存为txt文本文件的方法
通过这10个教程学习Maya的基础知识(二)
一文教会你使用Matplotlib绘图
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券