腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
函数
删除
数据
帧
中
的
无效
值
,
但
随后
返回
具有
无效
值
的
原始数据
帧
python
、
pandas
我创建了这个简单
的
函数
: def cleanup_data(*argv): df = df.dropna() return argv 但是我
的
代码出了什么问题?
浏览 14
提问于2021-09-25
得票数 1
回答已采纳
1
回答
pyspark:可以向空
的
dataframe或rdd添加行吗?
pyspark
、
spark-dataframe
我已经将
数据
帧
转换为RDD,并且正在逐行检索。在每一行上,我解析每个列
值
,如果某个特定
的
列
无效
,则使用列名和
值
添加到字典
中
。我已经使用表模式创建了一个空
的
数据
帧
。是否可以将行添加到空
的
数据
帧
<
浏览 0
提问于2016-06-30
得票数 1
1
回答
为什么"groupBy agg count alias“不创建新列?
apache-spark
、
hadoop
、
apache-spark-sql
alias("count")) .limit(3)它在以下行失败:.orderBy(df("count").desc),说明没有这样
的
列
浏览 2
提问于2018-11-08
得票数 0
1
回答
带有自定义聚合
函数
并将结果放入新列
的
pandas groupby()
python
、
pandas
、
dataframe
、
pandas-groupby
假设我有一个有3列
的
数据
帧
。我想按其中一列对其进行分组,并使用自定义聚合
函数
为每个组计算一个新
值
。 这个新
值
具有
完全不同
的
含义,它
的
列没有出现在
原始数据
帧
中
。因此,实际上,我希望在groupby() + agg()转换期间更改
数据
帧
的
形状。
原始数据
帧
看起来像(foo, bar, baz),并且
浏览 2
提问于2018-11-08
得票数 7
回答已采纳
1
回答
pyspark
中
包含空
值
的
行数
python-3.x
、
pyspark
考虑一个pyspark
数据
帧
,例如vals = [(1, 2, 0),(None, 0, 1),(5,None,9)]+----+----+----+|null| 0| 1|+----+----+----+ 我想写一段代码,
返回
2作为包含空
值
的</
浏览 1
提问于2018-08-09
得票数 0
3
回答
在pandas
中
从较大
的
数据
帧
中
删除
较小
数据
帧
中
的
值
python
、
pandas
、
dataframe
我在pandas中有一个非常大
的
数据
帧
,其中一列被标记为"Col2“,该列
的
行
值
包含一个长字符串。我从这个
数据
框
中
解析出另一个较小
的
数据
框,其中包含我想要从
原始数据
框
中
删除
的
列"Col2“
值
。基本上,我希望遍历
原始数据
帧
,并根据与子集
数据
帧
匹配
的<
浏览 0
提问于2015-11-19
得票数 0
4
回答
Python Pandas:为源列
的
每个不同
值
创建一个新列(将布尔输出作为列
值
)
python
、
python-3.x
、
pandas
、
dataframe
、
dummy-variable
我正在尝试根据
数据
帧
的
内容将其源列拆分成多个列,然后用布尔
值
1或0填充这个新生成
的
列,方法如下:ID source_columnB NaNE value 2 0 1 0 我想过手动创建每个不同
的
列,然后为每个列和.apply使用一个
函数
,
浏览 9
提问于2018-02-06
得票数 2
1
回答
从宽格式
的
时间序列
数据
中
移除前两个有效
数据
点
python
、
pandas
、
dataframe
对于customer X2,我
的
数据
从2018年8月开始,因此该行
的
前7列为空。对于customer X3,我
的
数据
从2018年1月开始,因此所有列都有
数据
点。对于每一行(即)每个客户,我想
删除
前2个
数据
点,并使它们为空。红色表示空
值
。对于X2,我
删除
了8月,没有9月
的
数据
,但有10月
的
数据
。所以,我必须
删除
8月和10月。 对于
浏览 0
提问于2021-02-16
得票数 0
2
回答
当特定列
中
的
值
小于之前
的
值
时,从
数据
框
中
移除行
python
、
pandas
我有一个有多行
的
熊猫
数据
帧
。在我可以生成绘图之前,我必须对time列执行过滤。通常情况下,时间
值
将以1 1Hz
的
速率增加,但有时会出现时间
值
向后移动
的
情况。我需要
删除
所有
具有
这些“
无效
”时间
值
的
行。
浏览 0
提问于2015-09-02
得票数 0
2
回答
将回归结果合并回
原始数据
帧
python-3.x
、
regression
、
pandas-groupby
我已经能够使分组
的
回归工作,但现在我希望将回归
的
结果合并回
原始数据
帧
中
,并得到索引错误。代码如下: xcol='time',ycol='value') 这将
返回
与
原始数据
集
具有
相同长度
的
一系列预测线性
值
,正如
函数
的
返回
<
浏览 56
提问于2019-06-07
得票数 0
回答已采纳
1
回答
删除
PySpark
数据
帧
中
具有
无效
多边形
值
的
行?
apache-spark
、
validation
、
pyspark
、
polygon
、
apache-sedona
我们在
数据
帧
上使用PySpark
函数
,这会引发错误。错误很可能是由于
数据
帧
中
的
错误行造成
的
。
数据
帧
的
架构如下:|-- geo_name: string (nullable = true)|--|-- geometry_multipolygon: string (nullable = true) |--
浏览 14
提问于2022-10-18
得票数 1
回答已采纳
1
回答
Scikit:从计算机而不是Numpy数组
返回
Dataframe时出现问题
python
、
pandas
、
numpy
、
dataframe
、
scikit-learn
我正在尝试使用scikit-learn IterativeImputer()来估算
数据
帧
中
的
一些缺失
值
。问题是,计算机将接受pandas
数据
帧
作为输入,
但
将
返回
一个numpy数组,而不是
原始数据
帧
。下面是取自此post
的
一个简单示例。numpy数组时,列名和其他元
数据
将被
删除
。当然,我可以手动从
原始数据
帧
中提取
浏览 5
提问于2019-06-26
得票数 6
回答已采纳
1
回答
基于另一个
数据
帧
改变
数据
帧
的
值
r
、
dataframe
再一次,我需要你
的
帮助来回答一个可能很简单
的
问题,这个问题对于初学者R用户来说是不清楚
的
。 我需要操作一个
数据
帧
,将NA
值
替换为“实际”
值
,以提供给另一个应用程序。
数据
框包含
值
-3.0,这是
原始数据
库
中
无效
值
的
标志。我需要
的
是用来自另一个
数据
帧
的
数据
替换所有
浏览 0
提问于2011-09-05
得票数 3
回答已采纳
1
回答
Python
中
的
数据
清理-替换为NaN
python
我正在努力清理熊猫
中
的
数据
帧
。
数据
形状是(142538,20).I已经
删除
了
数据
中
的
所有空格和重复行。形状缩小到(135345,20)。我需要用NaN
删除
包含
无效
值
的
列,然后
删除
结果,
但
形状保持不变,即使存在包含
无效
值
的
列。以下是替换列
中
无效</em
浏览 32
提问于2021-07-01
得票数 1
2
回答
根据另外两个
数据
帧
的
两个条件创建新
的
数据
帧
r
、
dataframe
、
data-wrangling
我是编程语言
的
新手,我被要求基于两个现有的
数据
帧
创建一个新
的
数据
帧
。
数据
帧
1是
原始数据
帧
,
数据
帧
2是
原始数据
帧
的
子集。新
数据
框需要是
原始数据
框
的
副本,如果它们满足df2
中
的
某些条件,则
删除
某些分数,即,如果样本ID匹配,则
浏览 4
提问于2020-06-23
得票数 0
1
回答
与Pandas
中
的
布尔
值
进行
无效
的
类型比较
python
、
python-3.x
、
pandas
、
numpy
、
type-conversion
正在尝试基于其他行级
数据
或
具有
类似
数据
的
其他
数据
帧
来清除pandas
数据
帧
(源)
中
的
Country (Ctry)列。有关示例
数据
框,请参阅链接。它最终将在
数据
帧
中提供两个新列,给出格式正确
的
国家和
数据
质量“分数”。Origin Dataframe Nafta, Countries, and States DataFrames 该
浏览 12
提问于2019-02-05
得票数 0
1
回答
Pandas group-by错误重复轴,
但
没有重复
值
python
、
pandas
pd.to_numeric(df['value']) df["diff"] = df.groupby(['GL','Class','month'])['value'].diff().fillna(df['value']) 我
的
pandasdf是这样
的
: index对象 类对象 value float64 glid对象 month对象 GL对象 Libelle对象 这是一个示例: ? “无法从重复
的
轴重
浏览 23
提问于2021-01-29
得票数 0
回答已采纳
2
回答
如何在不获取额外行
的
情况下合并两个
数据
帧
?
python
、
pandas
基本上,我有两个
数据
帧
,第一个看起来像这样: ? 第二个是这样
的
: ? 我想要获取第二个
数据
帧
的
"lat“和"lnt”列,并仅当两个
数据
帧
中
的
城市名称匹配时才添加到第一个
数据
帧
中
。我尝试使用pd.merge(),但它创建了
具有
重复
值
的
新行。如果可能,我希望在没有任何匹配<em
浏览 19
提问于2021-08-12
得票数 0
回答已采纳
1
回答
从
具有
不同索引
的
另一个
数据
帧
在pandas
数据
帧
中
添加新列
python
、
pandas
、
dataframe
这是我
的
原始数据
帧
。 feature_file_df['RESULT']=RESULT_df['RES
浏览 0
提问于2017-09-25
得票数 29
回答已采纳
2
回答
如何从dplyr管道
中
的
函数
中提取多个
值
r
、
dplyr
、
time-series
、
tidyverse
例如,假设你有一个这样
的
数据
帧
: x y 2 3 6 4 你有一个
函数
同时
返回
总和和乘积: sum_and_product <- function(x, y) list(sum=x+y,product=x*y) 那么,如何让管道生成
原始数据
帧
,这些
原始数据
帧
通过一个调用计算出
的
sum和product列进行了丰富呢?为了让您更好地了解我在实际生活用例
中
尝试实现
的
浏览 23
提问于2021-09-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
StackOverFlowError的原因和解决方案
使用pdb进行Python调试
贰 | 数据类型5 —— 关联数组
2017年最全的excel函数大全11—多维数据集函数
python中的生成器函数是如何工作的?
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券