腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
pandas
中
使用
apply
会在
数据
帧
中
占用
很长
时间
、
、
我正在尝试
使用
数据
帧
中
的应用函数。 下面是示例
数据
框。import
pandas
as pddf['T'] = [23,35,55]df['H']= df.
apply
(lambda x: HAPropsSI('H',
浏览 35
提问于2021-09-22
得票数 0
1
回答
迭代
pandas
dataframe
中
的列和行
、
、
、
、
我试图遍历我拥有的
数据
帧
,并
使用
单元格内部的值,但我需要
使用
单元格所来自的列和行的名称。,因为我正在
使用
它们
在
另一个具有相关信息的
数据
框
中
查找值。我知道
在
pandas
中
for循环永远都会耗费
时间
,但是我还没有找到任何关于如何同时迭代行和列以及同时迭代的示例。还有这一点:因为
a
浏览 6
提问于2016-02-06
得票数 0
1
回答
使用
apply
对
pandas
dataframe行进行条件计数的pythonic方法是什么?
、
、
我正在尝试对
pandas
数据
帧
中
的记录进行条件计数。我是Python的新手,并且有一个
使用
for循环的有效解决方案,但是
在
大约200k行的大型
数据
帧
上运行这个循环需要
很长
时间
,我相信有一种更好的方法可以通过定义一个函数并
使用
apply
来完成这一点,但是我
在
解决这个问题上遇到了麻烦创建一个包含两列的
pandas
数据
帧</e
浏览 2
提问于2020-06-07
得票数 0
1
回答
使用
python
在
SQL Server
中
快速插入
数据
、
、
、
、
我要将CSV文件
中
的
数据
插入到Azure上托管的SQL Server
数据
库
中
。我能够
在
表
中
插入
数据
,方法是将
数据
读取到
pandas
数据
帧
中
,并在python
中
的for循环中
使用
insert语句。我正在
使用
pyodbc。这种方法需要
很长
时间
才能插入
数据
。我也尝试过pd.to_s
浏览 0
提问于2019-10-14
得票数 0
3
回答
Angularjs
在
$
apply
中
的性能问题,但是绑定速度很快
、
、
我有一个中等大小的角度应用程序,它
使用
角-1.2.10和用户界面路由器-0.2.8。当我转换到特定的状态时,无论我是
在
ng显示中
使用
$animate还是手动动画,我都
会在
动画上得到
帧
速率问题。当我深入剖析分析器时,我可以看到XHR之后的$
apply
占用
了多达200 is。我认为这是延迟的原因。当我删除我要进入的状态
中
的代码时,这个问题就会如期而至。 更新我已经完成的incoginto模式,并
使用
$digest计数器运行相同的测试。
浏览 3
提问于2014-02-17
得票数 4
回答已采纳
3
回答
快速将JSON列转换为
Pandas
数据
帧
、
、
我正在从一个
数据
库(JSON行)
中
读取
数据
,其中一列被存储为50k+。我想把它提取到一个熊猫
数据
帧
中
。下面的代码片段运行得很好,但效率相当低,而且
在
整个
数据
库上运行时会耗费
很长
时间
。import
pandas
as pd df = pd.read_csv('http://pastebin.com/raw/7L86m9R2
浏览 1
提问于2016-12-18
得票数 24
回答已采纳
1
回答
从cassandra读取大量
数据
到python dataframe (内存错误)
、
、
、
我正在尝试从cassandra到
pandas
数据
帧
读取2048维的特征向量(1百万条记录),每次都会崩溃。我有32 GB的内存,但是我仍然不能把所有的
数据
读到内存
中
,每当我试图在内存中加载
数据
时,我的python程序就会崩溃。为了我的机器学习算法,我需要内存
中
的所有
数据
。(我的csv
数据
大小是18 is。)
在
pandas
数据
浏览 38
提问于2019-08-21
得票数 2
回答已采纳
1
回答
如何按Dask列出正在运行的进程?
、
我开始
使用
dask了。就我自己(以及我想向其演示dask的同事)的理解而言,我想构造一个基本的
数据
帧
,执行一个基本的操作,并将执行
时间
与仅限
pandas
的实现进行比较。() 我之所以
使用
多进程调度程序,是因为我希望看到进程出现在一个单独的shell
中
的ps aux | grep python调用
中
。出于演示目的,是否有一种方法可以列出dask正在
使
浏览 2
提问于2018-06-05
得票数 0
1
回答
对于
很长
的
数据
库,有没有办法知道panda `to_csv`的状态?
、
在
Pandas
中
,我有一个非常大的
数据
帧
,我正在尝试将其写入CSV文件。它花费了
很长
的
时间
(几个小时,还没有完成),我想知道是否有任何方法可以检查此命令
中
的完成百分比。我
在
to_csv
中
查找了所有的论点,但似乎没有任何帮助 https://
pandas
.pydata.org/
pandas
-docs/stable/reference&
浏览 2
提问于2019-06-10
得票数 1
回答已采纳
2
回答
尝试
使用
值[row_indexer,col_indexer] =.loc,
、
这是我的代码,当我试图运行它时,我得到了这样的错误:“SettingWithCopyWarning:一个值正试图被设置
在
来自DataFrame的切片的副本上。尝试
使用
.locrow_indexer,col_indexer = value来代替”请帮助。我该怎么做?temp_df是train_df的副本,它是主
数据
帧
( Paris_AirBNB )的切片 temp_
浏览 0
提问于2020-10-21
得票数 0
1
回答
计算滚动窗口中第一个和最后一个值之间的差异
、
、
、
、
我
在
一个单列
数据
帧
上
使用
Pandas
滚动窗口工具,该
数据
帧
的索引为日期
时间
形式。df2 = df.rolling('3s').
apply
(...)
浏览 4
提问于2018-01-11
得票数 4
回答已采纳
1
回答
创建新的
Pandas
分组对象
、
、
在
某些转换
中
,我似乎被迫脱离
Pandas
dataframe分组对象,而我想要一种返回到该对象的方法。 给定一个
时间
序列
数据
帧
,如果按
数据
帧
中
的一个值分组,我们将获得一个从键到
数据
帧
的底层字典。因为结构是dataframe的关键,所以不能
使用
.from_dict()将该结构转换回Dataframe。据我所知,返回
Pandas
而不进行一些繁琐的列重命名的唯一方法是将
浏览 0
提问于2014-05-06
得票数 0
2
回答
如何在一个
pandas
dataframe行
中
添加具有相同id的所有元素?
、
、
我有下面的
pandas
数据
帧
,我希望
在
不丢失id和fruit列的
时间
顺序的情况下,将元素序列转换为单个列。101 watermelon102 orange105 lemon105 apple例如,新的
数据
帧
应如下所示的def foo(row): return ', '.j
浏览 40
提问于2018-06-03
得票数 1
回答已采纳
2
回答
将spark的MLLib例程与
pandas
数据
帧
一起
使用
、
、
、
我有一个非常大的
数据
集(大约20 it )存储
在
磁盘上,名为
Pandas
/PyTables,我想在它上面运行随机森林和增强树。尝试
在
我的本地系统上做这件事需要
很长
时间
,所以我想把它租给一个我可以访问的spark集群,而不是
使用
MLLib例程。虽然我已经设法将
pandas
数据
帧
加载为spark
数据
帧
,但我对如何在MLLib例程中
使用
它感到有点困惑。我不太熟
浏览 1
提问于2015-05-06
得票数 0
1
回答
在
Pandas
数据
帧
元素上应用条件
、
、
、
、
我正在学习Python,我试图理解
apply
()方法
在
Pandas
数据
帧
中
是如何工作的。作为练习,我想
使用
一行代码对
Pandas
dataframe的元素应用str.upper()方法,前提是这些元素是字符串。我想将lambda条件表达式与
apply
结合
使用
,但问题是,当
apply
调用
Pandas
dataframe时,dataframe --如果我理解得很好的话--返回一个要应用
浏览 5
提问于2017-01-22
得票数 7
回答已采纳
1
回答
Hbase1.2.1到
pandas
数据
帧
、
、
、
我
在
hbase(v-1.2.1)中有一个表,我想在上面应用一些机器学习技术。因此,我想将我的表从hbase加载到
pandas
dataframe。我不能
使用
happybase,因为它只适用于hbase 0.9.x版本。 `
浏览 0
提问于2016-04-27
得票数 0
1
回答
预处理后的csv
数据
集重建
、
、
我加载了一个用于
数据
预处理的csv文件。完成
数据
预处理后,并不需要csv文件
中
的所有列。因此,我只想通过提取一些必要的列来重建csv文件。我应该
使用
什么代码?但我只需要a,b,c,d,因此, before csv file : columns = a,b,c,d,e,f,g,h,i after csv file : columns = a,b,c,d *
数据
集非常大,大约6 6gb *python 3.6.9 *
使用
pandas
浏览 14
提问于2020-01-09
得票数 0
回答已采纳
1
回答
如何
使用
Azure databricks
在
第二代ADLS的多张工作表
中
读写excel
数据
、
、
、
我想
使用
pyspark
在
Azure databricks
中
实现以下逻辑。我有一个下面的文件,其中有多张纸。我想将所有工作表的
数据
读入一个不同的文件
中
,并将该文件写入到ADLS2
中
的某个位置。注意:所有工作表都有相同的模式( Id,名称)
浏览 4
提问于2021-10-27
得票数 0
1
回答
Python-
Pandas
-Dataframe-日期
时间
转换,不包括空值单元格
、
、
、
、
感谢您抽出
时间
来看我的问题。<class '
pandas
.core.frame.DataFrame
浏览 0
提问于2017-09-06
得票数 1
回答已采纳
2
回答
使用
大型
数据
集的
pandas
中
的
时间
复杂性与内存
使用
量
、
、
我想知道
在
id_row
数据
框
中
创建列的最有效方法是什么,如果给定的列表
中
存在一个
pandas
,那么它将返回1或0。 我目前正在
使用
lambda函数来应用结果。我的问题是它花费了
很长
的
时间
,因为我的
数据
帧
大约有2M行,它检查的列表
在
200k到100k之间。如果我没记错的话,这是二次
时间
(我真的不确定),在这种情况下,根据对象的大小,它运行得非常慢。最糟糕的是,我不得不对100多个其他
浏览 3
提问于2019-08-07
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券