腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
pandas
中
乘以
浮动
列
需要
花费
太多
的
时间
python
、
pandas
、
optimization
、
floating-accuracy
早上,我有一个460.000行
的
DataFrame,有15
列
。我尝试将另外两
列
的
乘积赋值给另一
列
,代码如下 df[df.colx == 'S']['prd'] = df['col1']*df['col2'] prd、col1和col2
的
数据类型都是float64。我在其他列上执行了许多操作,没有任何问题,包括日期差异,它们几乎是立即执行
的
。如果我尝试 df['prd']
浏览 6
提问于2019-06-11
得票数 1
回答已采纳
1
回答
熊猫分类特征组占用了
太多
的
内存和
时间
python-3.x
、
pandas
、
pandas-groupby
我试图理解为什么熊猫
的
分类特性占用了
太多
的
RAM,因此执行起来
花费
了
太多
的
时间
。,cat_4都是int64,
列
value是
浮动
的
。我可以使用groupby命令轻松地计算
列
value
的
平均值,如下所示: df.groupby(['cat_1', 'cat_2', 'cat_3', 'cat_4']).ag
浏览 6
提问于2019-11-20
得票数 1
回答已采纳
1
回答
从索引
中
获取相应
的
值
python
、
numpy
我有一个目标
列
Value_0,Value_n和索引
列
idx_0。idx_k I想得到相应
的
列
Value_{idx_0},.Value_{idx_k}但是我有这三个困难。索引
列
类型为float索引
列
可以有NaN值如果索引列有NaN值,我希望输出列
在
相同
的
位置返回NaN值。 我怎样才能有效地做到这一点(以一种粗制滥造
的
方式,不
需要
循环)?我怀疑写像Value[Idx[~np.isnan(Idx)].astype(int)
浏览 2
提问于2021-07-19
得票数 0
2
回答
将不同
的
值
乘以
其他
列
的
组合作为
pandas
列
python
、
pandas
、
pandas-groupby
、
data-wrangling
下面是示例数据,对于每个name和skill1组合,我想将score
列
乘以
2,3: ? 输出: ? 我尝试了下面的代码,但它
花费
了400 skill1
太多
的
时间
。 ?
浏览 33
提问于2021-06-26
得票数 0
2
回答
熊猫散
列
函数
的
矢量化
python
、
pandas
、
vectorization
我有以下数据集(具有不同
的
值,只
乘以
相同
的
行)。我
需要
组合这些
列
并对它们进行散
列
,特别是使用库hashlib和提供
的
算法。问题是它
花费
的
时间
太长了,不知怎么
的
,我觉得我可以将函数向量化,但我不是专家。我正在处理数以百万计
的
行,这
需要
花费
几个小时,即使散
列
4
列
浏览 6
提问于2021-09-07
得票数 0
回答已采纳
1
回答
如何在数据量巨大
的
数据库表
中
添加新
的
列
mysql
、
sql
、
database-performance
我
在
表格中有大量
的
数据,比如TB data.While
的
数量,
在
表格
中
添加新
的
列
,这
需要
花费
很多
时间
。假设发布了2.0版,如果我们想要将每个客户
的
数据库升级到2.0版,我们将在表
中
添加新
的
列
。为每个客户
花费
大量
时间
进行升级。根据我们
的
要求,每个版本都会在数据库表
中
添加新<em
浏览 25
提问于2020-01-23
得票数 0
2
回答
通过从不同
的
数据帧
中
获取值并对其执行一些数学运算来创建新
的
pandas
数据帧
python
、
pandas
、
dataframe
假设我有一个16
列
、大约1000行
的
pandas
数据帧,格式如下x_sec01 y_sec01 x_sec02 y_sec02 x_sec03 y_sec03 x_sec04 y_sec04 x_sec05 y_sec05 x_sec06其中每
列
的
值
需要
乘以
浏览 10
提问于2017-01-11
得票数 2
回答已采纳
1
回答
使用
Pandas
- Python将date+hour
列
划分为两
列
(格式化日期、数字)
python
、
pandas
、
date
我想把这两
列
分成两
列
,因为Excel提取函数占用了
太多
的
时间
,我想我可以用Python和Jupyter Notebook来做,使用
Pandas
。我试着使用excel,但它总是
花费
很长
时间
。
浏览 5
提问于2019-07-18
得票数 0
回答已采纳
2
回答
有什么方法可以加速
Pandas
的
文件读写吗?
python
、
pandas
我
在
Pandas
中
读写中等大小
的
excel文件有困难。我有5个文件,每个约300 MB大。我
需要
将这些文件合并为一个文件,进行一些处理,然后保存它(最好是excel ):f2 =f2,f3,f4,f5], axis=0, ignore_index=True, sort=False) FULL.to_excel('filename.xlsx'
浏览 3
提问于2020-01-23
得票数 2
回答已采纳
1
回答
分离数据柱
python
、
pandas
、
dataframe
我目前
的
困境:当我下载一个csv文件时,我认为它将被分成三个单独
的
列
,分别是Nouveaux cas和Cumulatif de cas,但是情况并非如此,这三个文件都被合并成一个
列
,只有一个我只想要与新手卡相关
的
数据,它在中间。我试图将其转换为tsv文件,并更改分离
的
数据部分,但这
花费
了
太多
时间
。有更简单
的
方法吗?我用来读取文件
的
代码:df=
pandas</em
浏览 4
提问于2021-05-17
得票数 0
回答已采纳
2
回答
地图功能
花费
太多
时间
(
Pandas
DataFrame)
python
、
pandas
、
dataframe
、
dictionary
我有一个熊猫Dataframe
的
形状:12.000.000x2(行x
列
),我
需要
应用一个映射函数,但是,当它只
需要
比较第1
列
的
每个日期和给定
的
日期时,
需要
花费
太多
的
时间
,例如,今天。║ ║╚════════════╩══════════╝import
pandas
as pd fr
浏览 5
提问于2020-02-11
得票数 1
回答已采纳
2
回答
通过python
中
的
300万条记录搜索子字符串
python
、
pandas
我有一个巨大
的
数据框架,它有3M记录,其中有一个名为description
的
列
。此外,我有可能
的
子字符串集约5k。 if (bool(re.search(ss,desc))):问题是,搜索5k
乘以
3M循环
花费
了
太多
的
时间
浏览 0
提问于2018-04-13
得票数 1
回答已采纳
1
回答
wp8.1运行时:如何让网格视图项目先向右,然后向下?
xaml
、
gridview
、
windows-phone
、
windows-phone-8.1
在
默认
的
Hub模板
中
,网格视图项首先放在底部,然后放在右边。例如:2 4 6 8 但是在这种情况下,如果有许多图像,Hub滚动起来会很长,而且到达第二部分
需要
花费
太多
时间
。如何让它们以这种方式
浮动
?
浏览 3
提问于2014-10-03
得票数 1
3
回答
数据库插入机制
sql
、
oracle
、
oracle10g
我有一个关于不同数据库
中
的
插入机制
的
问题。假设一个表只有一个自动生成
的
列
主键(如标识
列
),那么
在
插入新记录时,整个表是否会被锁定?如果插入
花费
了
太多
时间
,其他事务是否
需要
等待更多
时间
?
浏览 1
提问于2012-02-13
得票数 4
回答已采纳
2
回答
在
中
获取用户
时间
的
总计
google-analytics
、
analytics
、
user-engagement
、
event-tracking
对于正在开发
的
应用程序,我们
需要
跟踪我们
的
用户(作为一个整体)
花费
多少
时间
观看与特定实体相关
的
内容。我们试图通过用户
时间
来实现这一目标,包括类别“实体名称”、变量“实体ID”(例如,类别"Band“、ID”“)。这使得获得每个实体观看内容
的
平均用户
时间
(
花费
的
时间
)非常容易,但我们也
需要
计算全部内容。似乎没有办法进行计算,这似乎很奇怪,因为这只是平均数<
浏览 0
提问于2014-03-27
得票数 0
1
回答
流灯加载
列
数据
花费
了
太多
时间
。
python
、
pandas
、
streamlit
我
在
streamlit中使用了简单
的
代码片段,它显示了由我拥有的excel组成
的
数据帧。问题是,
在
流光区域
的
过滤器
列
中加载数据
需要
花费
太多
时间
。在那个过滤区域,我搜索材料
的
名称,但它甚至
需要
30秒来加载和显示我要选择
的
数据。如何解决这一问题,使其快速选择数据?守则是:import
pandas
as
浏览 1
提问于2020-01-29
得票数 0
2
回答
使用python绘制csv文件系列
python
、
plot
从csv文件
中
读取数据,然后生成不同
列
的
图形,其中每一
列
以不同
的
颜色绘制,这是一种非常有效
的
方法?我感兴趣
的
是一种可以推广到多个
列
的
方法。我尝试
的
方法运行起来
花费
了
太多
的
时间
。我尝试过使用matplotlib.pyplot
的
pandas
.DataFrame.from_csv,但我
的
实现可能不正
浏览 0
提问于2014-10-26
得票数 0
2
回答
如何避免unordered_map
在
插入过程
中
的
滞后调整
c++
、
performance
、
visual-c++
、
hashmap
、
unordered-map
我
在
MSVC 2010
中
使用unordered_map。如果我在其中插入许多元素,它就会开始调整大小。在此过程
中
,它复制所有对并重新散
列
它们。当有
太多
的
对象时,
需要
花费
太多
的
时间
。
浏览 2
提问于2012-07-25
得票数 3
回答已采纳
2
回答
如何在包含3000万行
的
mysql表
中
查找重复值
mysql
、
sql
在
Mysql
中
,我有一个包含两
列
(id、uuid)
的
表。然后我向其中插入了3000万个值。(ps: uuid可以重复) 现在,我想使用Mysql语法
在
表
中
查找重复值,但是sql
花费
了
太多
时间
。我想搜索所有
列
,但这
需要
很多
时间
,所以我尝试查询前一百万行,这
花费
了8秒。 然后我尝试了1000万行,它花了5分钟,然后2000万行,服务器似乎死了。
浏览 15
提问于2019-01-30
得票数 0
回答已采纳
1
回答
包含大数据
的
已选择下拉列表
jquery
、
ajax
、
dropdown
、
jquery-chosen
我使用了一个选择
的
下拉列表,我将数据从DB表显示到选择
的
下拉列表
中
,它有将近90k行
的
数据。
在
选择
的
下拉列表中加载数据
需要
花费
太多
的
时间
&因此页面加载也
需要
花费
太多
的
时间
。有没有人能帮我
在
选择
的
下拉列表
中
减少页面加载
时间
和数据加载?
浏览 2
提问于2018-07-05
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
不会Pandas怎么行
懂Excel就能轻松入门Python数据分析包pandas:分段匹配
新年Flag:搞定Python中的“功夫熊猫”,做最高效的数据科学家
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券