腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8752)
视频
沙龙
0
回答
对
`
DataFrame
`
行进
行
内存
高效
过滤
、
、
、
我有一个很大的
DataFrame
对象(1440,000,000
行
)。我在
内存
(包括交换)限制下操作。我发现了和方法,但它们
对
列标签/
行
索引进行操作,而不是
对
行数据进行操作。
浏览 2
提问于2017-06-08
得票数 3
回答已采纳
4
回答
只
过滤
满足条件的第一
行
的有效方法?
、
library(dplyr) label = c("a","a","b","a","c","c","a")data$index <- 1:nrow(data) label index <
浏览 8
提问于2020-11-26
得票数 2
回答已采纳
1
回答
熊猫--在
DataFrame
中是否有一种同时进行多种操作的方法?
、
、
下面的代码将使用从配置文件动态生成的不同查询执行超过150万次csv_file_profit = pd.read_csv('C:\\Users\\test_data.csv') profit_sum = csv_file_profit.query(query_str)['P/L'].sum() trans_count = csv_file_profit.query(query_s
浏览 2
提问于2020-05-28
得票数 0
回答已采纳
1
回答
在Python中共享具有循环多处理的大熊猫
DataFrame
、
、
、
在Windows机器上使用Python2.7,我在一个SQL查询中有一个大型的pandas
DataFrame
(大约700万
行
和20+列),我想通过循环‘d来
过滤
这个查询,然后
对
结果
过滤
的数据运行计算我知道,如果我尝试使用Windows中的multiprocessing包中的标准方法,每个进程将生成一个大型
DataFrame
的新实例,供其自己使用,而我的
内存
将被消耗殆尽。因此,我试图使用我在上读到的信息,使我的
DataFrame
成为一个代理对象,并在
浏览 0
提问于2016-02-24
得票数 1
4
回答
Pandas
DataFrame
的空拷贝
、
、
我正在寻找一个
高效
的成语,用于创建一个新的Pandas
DataFrame
,其列和类型与现有的
DataFrame
相同,但没有
行
。下面的方法可以工作,但可能效率要低得多,因为它必须创建一个长的索引结构,然后
对
每一
行进
行计算。我假设这是行数中的O(n),我希望找到一个O(1)解决方案(这还不算太糟)。在R中比较,一个很好的成语是做df[0,],因为没有零
行
。df[NULL,]也能工作。
浏览 5
提问于2020-12-07
得票数 6
回答已采纳
1
回答
熊猫-检查列中的值是否是同一列中另一个值的子字符串。
、
、
、
、
我正在尝试编写一个脚本,它检查
DataFrame
的一个列,即每个值不是另一个值的子字符串,也不等于一个不同的列。我编写了一段代码,
对
每一
行进
行迭代并返回其他的子字符串值。举个例子: df = pd.
DataFrame
({'names': ['Bob', 'Sam', 'Tom', 'Bob'], 'value': ['abc', 'ab', 'de
浏览 1
提问于2019-11-20
得票数 2
回答已采纳
2
回答
如何将一
行
的值与所有其他
行进
行比较?
、
、
我想比较一下熊猫的每一
行
和所有其他
行
。拥有这个
DataFrame
: 2我知道我需要在变量中保留索引A的
行
,然后将其与循环中的所有其他
行进
行比较。完成此操作后,我将使用索引B移动到
行
,并
对
其他
行
重复此操作,包括带索引A
浏览 4
提问于2019-10-10
得票数 0
回答已采纳
1
回答
对象相似度Pandas和Scikit学习
、
、
是否有一种方法可以找到Pandas
Dataframe
中的
行
并根据它们与另一
Dataframe
中的一
行
的相似程度
对
行进
行排序?
浏览 0
提问于2017-08-09
得票数 1
回答已采纳
2
回答
通过检查一
行
的每一个元素
过滤
熊猫的数据
、
、
、
我有一个
dataframe
,它包含列中的一个对象。id_original'].iloc[0].ClassOut[20]: u'Classtype2'是否有任何方法可以用.isin
浏览 0
提问于2018-06-13
得票数 2
回答已采纳
2
回答
如何获取熊猫数据中单元格的内容
、
、
我希望能够在表中取出一个值,并在代码中的其他地方引用它,但我只能让print语句打印列。Animal, Name, AgeCat, John, 8}import pandas as pd 它应该打印出Ege (单元格的内容,而不是带索引的整列)。
浏览 0
提问于2021-05-13
得票数 3
回答已采纳
1
回答
如何根据状态列拆分Pandas DataFrames
、
、
、
、
我有一个看起来像下面这样的
DataFrame
: 0 0 2 20 2现在,我想选择状态为== 2的所有
行
,并
对
结果
行进
行分组,这些
行
不会被任何其他行状态打断,这样我以后就可以单独访问每个组。A 1 6 2 18 3 8 2 18 有没有一
浏览 6
提问于2021-05-16
得票数 0
回答已采纳
2
回答
如何在一列由numpy数组组成的列上使用条件来索引数据帧?
、
我目前有一个pandas
dataframe
,它有一列数值是numpy数组。我正在尝试获取数据帧的
行
,其中列的值是一个空的numpy数组,但我不能使用pandas方法进行索引。B', 'C', 'D'], 'stats': [np.array([1,1,1]), np.array([]), np.array([2,2,2]), np.array([])]} df = pd.
DataFrame
(data) 我尝试只获取‘KeyError’为None的
行
,但
浏览 18
提问于2021-08-24
得票数 0
回答已采纳
1
回答
多指标熊猫
DataFrame
的慢速迭代
、
、
我有一个很大的
dataFrame
,有三个索引我已经确定了符合“i”和“j”给定公式的feasible_i_j
行
,这样我就可以使用.loc
过滤
df现在,我想
对
行进
行
dataFrame
筛选,这些
行
的'k‘返回来自某些函数foo的True fo
浏览 0
提问于2019-09-06
得票数 0
回答已采纳
2
回答
根据列值保持数据帧的行数百分比
、
假设我有一个这样的数据帧:df = pd.
DataFrame
({'id':['A','A', 'A', 'B','B'], 'value':[2, 4, 6,3, 4]}) col1 col21 A
浏览 2
提问于2020-03-13
得票数 2
1
回答
基于标准的熊猫样本
、
我想使用熊猫的功能,但有一个标准,不分组或
过滤
数据。import pandas as pd这将对100
行进
行示例,但是如果我想要示例包含df['a']中1的0到50
行
的50
行
,该怎么办
浏览 3
提问于2017-11-22
得票数 3
回答已采纳
1
回答
如何将`pandas.
DataFrame
`存储在熊猫中--可加载的二进制格式,而不是“寻址”
、
、
、
、
我在节省pandas.
DataFrame
(14万
行
)方面有问题。 从API中可以看到,存储(然后加载)数组的唯一可用选项是CSV或泡菜。保存泡菜格式以一个神秘的异常(SystemError: error return without exception set)结束,而使用CSV保存是浪费空间,即使它是压缩的(2字节长的np.float16比ASCII编码的值
高效
得多如何以可加载的、
内存
高效
的(包括磁盘空间)格式存储数据?
浏览 2
提问于2017-06-12
得票数 0
回答已采纳
1
回答
我如何迭代星火的
DataFrame
行
?
、
、
、
我需要对
DataFrame
行进
行迭代。我不想每次都将其转换为RDD并
过滤
所需的
行
,例如:def next = { index += 1} 有一个选项可以调用“收集”方法,它将返回ArrayRow,并
对
其进行迭代,但我相信,当有大量数据时,它将不起作用。val rowsIterator:Iterator[Row] =
浏览 3
提问于2018-01-08
得票数 3
4
回答
熊猫FutureWarning切片0.21.0
、
、
、
我正在尝试选择
dataframe
子集的一个子集,只选择一些列,并
对
行进
行
过滤
。现在正确的切片和
过滤
方法是什么?
浏览 12
提问于2017-12-19
得票数 41
回答已采纳
2
回答
如何在数据库中读取列?
、
、
Employee where name = 'Scott'; 通过从6.30到8.30(2分钟)的视频之后,我的理解是在关系数据库(如oracle/Mysql等)下,即使我必须读取两列,数据库管理系统也会从
内存
中读取完整的
行
,然后它将根据名称
对
行进
行
过滤
,最后读取列工资。
浏览 0
提问于2017-07-23
得票数 1
回答已采纳
1
回答
拥有vs WHERE和聚合函数MySQL工作台
、
上下文:I
对
编码非常陌生,在过去几个月转向之前,从开始大约2个月。我几乎是自学的,使用youtube视频和通过Udemy上课(就像选择这个问题听起来很傻一样)。我正在解决一个练习问题。我知道,一般来说,WHERE用于查询vs中所有记录的一般条件,用于进一步
过滤
,可以用于聚合函数,而WHERE不能用于聚合函数。我使用了我的代码中的位置和解决方案所使用的位置,但是每个代码都有一些不同。
浏览 1
提问于2022-07-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券