腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
pandas
中提
高行
操作
的
速度
、
我正在上Coursera
的
课程,我有一个数据集可以对其执行一些
操作
。我已经得到了这个问题
的
答案,但我
的
答案需要时间来计算。 2000-Q1
的
新值应该是这三个值
的
平均值。同样,2000-04、2000-05、2000-06将变为2000-Q2,新值应为2000-04、2000-05、2000-06
的
平均值。下面是我是如何解决这个问题
的
。首先,我定义了一个函数quarter_rows(),它接受一行数据(
浏览 5
提问于2017-01-15
得票数 2
回答已采纳
1
回答
当行人使用任何逻辑进入时,如何在从PedSource设置一个
速度
后,在出口时改变行人
的
速度
?
使用pedSource,我设定了进入建筑物时
的
舒适和初始
速度
在
1米/秒左右,但我想提
高行
人
的
速度
,当它离开时,它是约2米/秒使用pedGoTo。我该怎么用任何逻辑来做呢?
浏览 0
提问于2019-05-20
得票数 0
回答已采纳
1
回答
在
pandas
列中存储列表
的
最有效方法是什么?
、
、
我有一个包含1亿条tweet
的
熊猫数据帧。我想在这些URL上运行分析(比如按域名排序,找出哪种类型
的
用户发布了哪些域)。是否可以像这样存储: 其中
的
URL列是具有动态大小
的
pandas
系列,以便我可以轻松处理?否则,
在
应用
pandas
操作
和
速度
的
同时,存储urls
的
最好方法
浏览 0
提问于2019-03-05
得票数 1
1
回答
如何在
pandas
中提
高iterrows
操作
速度
、
、
我有一个数据框,其中包含数千个条目,其中包含不同变量组合
的
回归结果。回归
的
组合是使用单变量列表和itertools组合函数形成
的
。我现在正在寻找一种方法来删除需要删除
的
变量组合,因为它们代表类似的度量。我已经列出了所有不能同时出现
的
变量。我
的
代码遍历包含组合
的
数据框,并使用collections.Counter函数计算重复列表中每一行中
的
元素数量。如果行中有两个或更多元素,则不会将该行复制到新清理
的
数据框中。我
的
代码
浏览 10
提问于2018-07-30
得票数 0
回答已采纳
1
回答
用于多数据帧
操作
的
Pandas
矢量化
、
我希望
在
pandas
中提
高
操作
的
速度
,我已经了解到,通常最好
的
方法是使用矢量化。我正在寻找帮助
的
问题是向量化下面的
操作
。设置:df2 =另一个(相当大
的
)表,其中包含日期-时间列和城市列for i, row in df2.iterrows(): for x,') and row['city'
浏览 2
提问于2019-11-15
得票数 0
回答已采纳
1
回答
在
Pandas
中提
高处理
速度
、
、
、
我正在比较垂直处理中一列上
的
一个dataframe和另外三个,我想知道这个过程是否可能使用更多
的
内核/使其更快?我试过concurrent.futures.ProcessPoolExecutor(),但它实际慢了1秒...这是我
的
代码 # df_out is main DataFrame, hikari_data_df
浏览 12
提问于2020-06-10
得票数 0
1
回答
如何使用python从GPS (经度和纬度)时间序列数据
中提
取
速度
和加
速度
特征?
、
、
、
我想从GPS数据
中提
取尽可能多
的
数字特征(经度和纬度)。我正在使用
pandas
和python。我感兴趣
的
主要特性是
速度
、横向和纵向加
速度
。 数据样本如下所示,每1秒读取一次。我
在
谷歌上搜索答案,然而,我只能找到
速度
和地图可视化
的
方程式。然而,我相信可以从这些数据
中提
取更多
的
特征。
浏览 1
提问于2017-09-27
得票数 2
1
回答
将dask dataframe转换为dataframe太慢,使用它并行处理时不会节省时间。
、
import
pandas
as pd import dask.dataframe as dd import timewarnings.simplefilter=1)d_data = dd.from_
pandas
{} sec'.format(time.time()-start))结果是: 花费时间是1.029724
浏览 0
提问于2018-09-29
得票数 0
回答已采纳
1
回答
从pypyodbc数据库查询返回单个字符串
、
、
、
、
我试图从MSSQL DB
中提
取一个值,代码如下所示:import pypyodbcdf = pd.read_sql_query(query, connection) 但是这会返回一个dataframe对象,是否有一个方法只返回一个字符串值,可能没有
Pandas
最重要
的
是
速度
。是否有一种更快捷
的
连接/查询方式
浏览 2
提问于2017-07-26
得票数 0
回答已采纳
1
回答
数据丢失,
在
现有.xlsx文件中添加新工作表时,具有多个工作表
的
.xlsx文件
的
格式已更改
、
、
、
、
我有一个包含多个sheet - shee1, sheet2 ,sheet3
的
Final.xlsx,每个表都有一些图形和数据。我有另一个文件file5.xlsx,我想添加到选项卡中
的
Final.xlsx中。下面的代码工作正常,但是Final.xlsx现有的工作表数据(内容、格式、grpahs等)丢失了。import
pandas
writer=
panda
浏览 4
提问于2018-08-29
得票数 0
1
回答
Pandas
函数将多输入函数应用于数据帧中
的
每个单元格?
、
我正在通过读取
pandas
中
的
csv文件来设置数据帧,列表示不同样本
的
一维位置参数中
的
点,每行表示0.01秒
的
时间段。我想创建一个新
的
数据帧来表示
速度
和加
速度
(所以基本上将
操作
[point(i)-point(i-1)]/0.01)应用于数据帧中
的
每个单元。我
在
使用
pandas
.applymap或其他方法时遇到了问题,因为我不太知道如何在每个
操作
的
浏览 30
提问于2019-04-28
得票数 0
1
回答
循环
操作
Pandas
中数据
的
速度
更快
、
、
我正在处理具有~(100000, 50)形状
的
熊猫数据格式,虽然我可以实现所需
的
数据格式和
操作
,但我发现我
的
代码运行所需
的
时间比预期
的
长(3-10分钟),这取决于具体任务,包括: 检查值是否包含在单独
的
列表或numpy数组中。将来我将拥有更大
的
数据帧,并希望确保使用适当
的
编码方法来避免非常长
的
处理时间。我发现我
浏览 3
提问于2016-09-12
得票数 1
回答已采纳
2
回答
xlsx中
的
getHighestColumn不工作
、
getHighestRow() return $this->objPHPExcel->setActiveSheetIndex(0)->getHighestRow();我
在
.xls和.xlsx中保存了相同
的
excel文件,它有10列(从B到K)和10行 当我使用getHighestColumn时,
在
.xls中我得到
的
是'K‘(正确),但在.xlsx中我得到
的
是AMK (所有excel工作表中
的
最后一列),使用.xls时我得到
浏览 1
提问于2013-04-09
得票数 6
回答已采纳
1
回答
基于时间戳
的
时间序列值
的
Numpy (或scipy)入库
、
、
、
例如: import numpy as npvalues = np.random.randomtimeseries_df.groupby("Bins").max()["Timestamps"] ds_values = timeseries_df.groupby("Bins").mean()["Values"] 这是可行
的
,但我正在编写可以重用
的</
浏览 18
提问于2021-11-05
得票数 1
回答已采纳
1
回答
在
Pandas
中合并索引上
的
数据帧效率更高
、
、
、
为什么
在
索引上合并
Pandas
中
的
数据帧比
在
列上合并数据帧更有效(更快)?import
pandas
as pd df = pd.DataFrame({'ID': [0, 1, 2, 3, 4],33, 41, 42, 50, 45, 28, 32]})df = df.set_index('ID') 这代表
浏览 1
提问于2018-06-21
得票数 18
1
回答
pandas
多个独立索引(非多个索引)
、
我
在
python中有几个大型
的
pandas
data frames,我想通过添加index来提高join
操作
的
速度
。
在
向database table添加索引
的
类似代码行中。当搜索时,我看到
的
只是multi-index选项。它看起来就像数据库中
的
composite index/multi column index。我需要
的
是几个列上
的
独立索引(独立,因为这些列是不相关<em
浏览 17
提问于2020-12-02
得票数 1
1
回答
Pandas
作为Flask应用程序
的
快速数据存储
、
、
、
、
运行转换
的
速度
、加载数据
的
速度
和
Pandas
的
易用性给我留下了深刻
的
印象,我想利用所有这些优秀
的
属性(以及其他)来对一些大型数据集(大约100-200k行,<20列)进行建模。其目标是
在
一些计算节点上处理数据,但也通过Flask
在
浏览器
中提
供数据集
的
视图。我目前使用
的
是Postgres数据库来存储数据,但是导入数据(来自csv文件)
速度
慢、
浏览 3
提问于2014-07-09
得票数 9
1
回答
oracle行锁
的
长队列时间
、
当我
在
oracle 9 DB中运行下面的Sql命令时,我一直遇到"enq: TX - row锁争用“。该表mytable是一个小表,少于300行。我知道我将面临这个死锁问题,但对我来说,问题是它们应该能够更快一些,因为表很小,所以更新它将是快速
的
。 编辑:我不能修改这段代码,它在第三方应用程序中。我只能调整数据库。我能做些什么来提
高行
锁队列
的
速度
?如何改进这个等待时间,使我
的
线程运行得更快?
浏览 1
提问于2010-03-11
得票数 2
回答已采纳
1
回答
为什么group_by -> filter ->汇总在R中比
pandas
快?
、
、
、
、
我正在将我们
的
一些旧代码从R转换到python。在这个过程中,我发现熊猫比R慢一点。我有兴趣知道我是否做错了什么。R代码(
在
我
的
系统上大约需要2毫秒): df = data.frame(col_a = sample(letters[1:3],20,T), a = sum(col_c == 'a'), c = a/b ) %>%
浏览 17
提问于2019-06-03
得票数 1
1
回答
有没有一种通过列表理解来迭代两个数据帧
的
更快方法?
、
、
我有两个数据帧,一个包含屏幕名称/显示名称,另一个包含个人,我正在尝试创建第三个数据帧,每次屏幕名称/显示名称中出现姓氏时,
在
新行中包含来自每个数据帧
的
所有数据。从功能上讲,这将创建一个可能匹配
的
名称列表。我当前
的
代码运行得很好,但运行
速度
非常慢,如下所示:# cols = 'userid','screen_name','real_nameReal_Name
浏览 0
提问于2016-04-11
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas 2.0 vs Polars:速度的全面对比
Swift高级分享-在Swift中提取视图控制器操作
Pandas与SQL的数据操作语句对照
Pandas的列表值处理技巧,避免过多循环加快处理速度
让pandas处理大数据速度变快的三个技巧
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券