腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6251)
视频
沙龙
1
回答
pandas
dataframe
函数
返回
日期
最近
且
其中
一列
包含
输入
值
的
行
,
抛出
错误
、
如果数据框列中存在特定
输入
的
最新
日期
,我正在尝试过滤
其中
的
行
。recent_date] else:如果列'id‘
包含
输入
id,则检查
最近
的
日期
,然后
浏览 12
提问于2019-07-22
得票数 0
1
回答
仅保存
pandas
df中
的
非空条目
值
和列号,每行仅保存一个非空
值
、
、
我有一个
包含
许多列
的
pandas
dataframe
,
其中
大多数列都是空
的
,但是对于每一
行
,总是有
且
只有
一列
的
值
是字符串。我在
dataframe
中创建了一个新列,它选择了唯一
的
非空
值
:for col in range(1,100) : data[label] = data[l
浏览 0
提问于2017-06-16
得票数 1
1
回答
如何在spark中使用
pandas
split-apply-combine风格策略和scala api?
、
、
、
我有一个scala
函数
,它接受一个spark
dataframe
并
返回
一个单
值
,也就是说两个
值
。这个
函数
很复杂,使用在
DataFrame
类中定义
的
聚合,调用其他java库,并且不能用SQL表达。它需要整个数据帧
的
内容来进行计算,它不能一次添加一
行
并建立一个结果。 我有一个大
的
dataframe
,
其中
包含
一个列,我想用它将
dataframe
浏览 28
提问于2020-04-22
得票数 0
1
回答
如果不存在列,则向
dataframe
追加空白
行
、
我有几个巨大
的
CSV文件(GB大小),我正在导入与
pandas
。这些CSV文件是由数据采集系统收集
的
数据转储,我不需要
其中
的
大部分,所以我使用usecols参数过滤掉相关数据。问题是,并不是所有CSV文件都有我需要
的
所有列(所使用
的
数据系统
的
属性)。 问题是,如果该列不存在于文件中,而是在usecols中指定,则read_csv将
抛出
一个
错误
。是否有一种简单
的
方法可以强制在
dataframe
浏览 2
提问于2017-03-30
得票数 1
回答已采纳
1
回答
我可以存储一个带有字典列
的
拼图文件吗?字典列
的
值
中有混合类型?
、
、
、
、
我正在尝试将Python
Pandas
DataFrame
存储为拼图文件,但我遇到了一些问题。我
的
Pandas
DF
的
其中
一列
包含
如下字典: import
pandas
as
pandas
"ColA": [1, 2, 3], { "
浏览 151
提问于2020-08-06
得票数 4
回答已采纳
4
回答
从另一个
Dataframe
列中为
Dataframe
中
的
每一
行
查找特定
值
、
、
、
我正在寻找替代方法,将Excel中使用
的
函数
替换为Python,特别是使用
Pandas
。
其中
一个
函数
是COUNTIFS(),我一直使用它在固定范围内定位特定
的
行
值
。这主要用于确定某
一列
中
的
特定
值
是否存在于另
一列
中。Excel中
的
示例如下所示:第一
行
的
代码(列: col1_in_col2): =COUNTIFS($B$
浏览 1
提问于2019-08-27
得票数 1
回答已采纳
1
回答
在具有NaN
值
的
pandas
数据帧上操作时
的
精度损失
、
、
、
我有一个
pandas
dataframe
,我想在
其中
减去两个列
值
: df = pd.
DataFrame
({"Label":["NoPrecisionLoss"],现在,当
输入
数据帧获得第二
行
且
其中
包含
nan
值
时: df2 = pd.
DataFrame
({"Label":["PrecisionLoss",
浏览 13
提问于2020-01-24
得票数 3
回答已采纳
1
回答
Python
Pandas
的
累积OLS
、
、
、
在
Pandas
中,
pandas
.ols
的
window_type参数有一个rolling选项,但这似乎隐含着需要选择窗口大小或使用整个数据样本作为默认
值
。我希望以累积
的
方式使用所有数据。我正在尝试对按
日期
排序
的
pandas
.
DataFrame
运行回归。对于每个索引
日期
,我希望使用从最小
日期
到索引i处
的
日期
的
可用数据运行回归。因此,窗口在每次迭代中有
浏览 5
提问于2013-02-27
得票数 5
回答已采纳
2
回答
熊猫:如果-否则就不写专栏了
、
、
如果
包含
在另
一列
中
的
日期
等于某一数据,则我想要定义一个列,
其中
我想放1或0。DF[['column_i']]= 0 if DF[['column_j']] == '1983-11-08' else 1 回溯(
最近
一次调用):文件"<pyshell#150>",第1
行
,在Accounts_conFa
浏览 2
提问于2016-07-08
得票数 0
回答已采纳
1
回答
如何在熊猫切片上应用lambda
函数
,并
返回
与
输入
数据帧相同
的
格式?
、
我想应用一个
函数
对熊猫中每一
行
的
数据切片进行处理,并为每一
行
返回
一个数据片段,
其中
包含
计算出
的
切片
的
值
和数量。所以,例如f = lambda x: (x - x.mean()) 我想要
的
是将lambda
函数</e
浏览 0
提问于2014-11-16
得票数 0
回答已采纳
1
回答
Python:查找
pandas
的
输入
DatetimeIndex.asof()
、
、
我正在尝试使用
pandas
.DatetimeIndex.asof()来查找与某个
日期
最接近
的
值
。但是,这个
函数
的
输入
到底是什么呢? 声明
输入
是一个标签,但是格式是什么呢?更具体地说,我有一个如下所示
的
DataFrame
,
其中
datetime列被设置为索引。我希望代码
返回
日期
时间最接近2018-07-28 13:00:00
的
行
<e
浏览 0
提问于2018-08-01
得票数 0
2
回答
按月营业日分列
的
DataFrame
组
、
、
、
、
我正在尝试分组一个
Pandas
DataFrame
,它是按
日期
按月
的
营业日编制索引
的
,大约每月22。是否有一个
函数
将
返回
一个月
的
营业日? 如果有人能提供一个简单
的
浏览 5
提问于2016-04-29
得票数 1
回答已采纳
3
回答
pandas
dataframe
python中
的
多行
、
、
、
对于
包含
多行
的
pandas
DataFrame
中
的
一列
,我希望创建一个新列,该列具有指定
的
行数,形成前
一列
的
行
的
子级。我尝试这样做是为了创建一个大型数据矩阵,
其中
包含
一系列
值
作为稍后模型
的
输入
。作为一个例子,我有一个小
的
DataFrame
,如下所示: A 1
浏览 4
提问于2017-07-18
得票数 4
2
回答
将
函数
(MinCovDet)应用于
Pandas
数据帧滚动窗口(n x m数组)
、
、
、
我有一个有3000
行
和20列
的
dataframe
df,
其中
包含
索引中
的
日期
。对于每一
行
,计算过去200天内
的
稳健协方差。我已经尝试过我得到一个TypeError:(“无法转换
输入
[
日期
\n2004-01-02更一般
的
问题是如何将
函数
应用于
pa
浏览 1
提问于2018-07-05
得票数 2
1
回答
NaT
值
存在时
的
熊猫累积最大
日期
时间
、
我有一栏“购买
日期
”。该列要么
包含
NaT,要么
包含
实际
日期
。),以便它
返回
最近
的
购买
日期
。data['Cummax_Purchase'] =
pandas
.to_datetime(data['Purchase_Date']).cummax() 当上述累积最大
值
是对应
行
中
的
NaT时,它们将
返回
一个但是,每当我将
pand
浏览 3
提问于2022-11-21
得票数 0
1
回答
Pandas
:如何从数据帧
的
特定列中减去两个非连续
行
中
的
值
、
、
我试图在
Pandas
中
的
一个新列中填充值,方法是减去同一df中另
一列
中两个非连续
行
的
值
。我可以这样做,只要df没有
包含
日期
的
列。但是如果它有一个列有
日期
,那么熊猫就会
抛出
一个
错误
。import
pandas
as pd df = pd.
DataFrame
(np.array([[1, 2, 3], [4, 5
浏览 2
提问于2021-03-04
得票数 2
回答已采纳
2
回答
当存在非数值时,如何执行数值查询?
我有一个
pandas
DataFrame
,
其中
一列
主要是数字,但也
包含
非数字
值
,如"None“。我想运行一个只
返回
大于某个阈值
的
数值
的
查询。但是,当我运行以下命令时:我得到一个
错误
: TypeError: '>=' not supported between instances of
浏览 23
提问于2020-05-28
得票数 0
1
回答
输入
文件不能从pd.read_csv读取
、
、
我试着用熊猫从apache beam中读取一个存储在google存储中
的
文件,但是得到了
错误
import
pandas
as pdip7 = ip2 | 'print' >> beam.io.WriteToText('gs://tegclorox/Output/merge1234') 当我执行上述代码时,
错误
表示路径不存在
浏览 0
提问于2018-03-01
得票数 0
回答已采纳
1
回答
Python
DataFrame
追加行删除最后
一列
、
我在
pandas
中将
行
添加到数据帧时遇到了问题。import
pandas
as pd和: df2 = df2.appe
浏览 3
提问于2018-06-27
得票数 0
2
回答
如何将多个变量传递给
pandas
dataframe
,以便将它们与.map一起使用来创建新列
、
要将多个变量传递给一个普通
的
python
函数
,您只需编写如下代码: do something....year from a date column我想知道
的
是,就像您可以将多个数据片段传递给单个
函数
一样(如上面的第一个示例所示),您是否可以在创建新
的
pandas
例如,将
日期
Y-M-D
的
三个独立部分合并到一个字段中。,它接受三列作为<
浏览 2
提问于2015-05-22
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(三):DataFrame
神秘熊猫探索记
这十二个用于Python 数据操作的 Pandas 方法你还不知道?
简单实用的pandas技巧:如何将内存占用降低90%
Python科学计算之Pandas
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券