腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Drop
时
,
pandas
中
的
非
相关
DF
中
缺少
相同
的
列
pandas
、
drop
对我来说很难理解...当我从dfocus1
中
删除cols 'Focus2','Score2','Focus3','Score3‘
时
,它在dfocus2
中
删除了
相同
的
cols 为什么?''' dfocus2=
df
print('\nTable data',dfocus2.info(memo
浏览 11
提问于2021-04-07
得票数 0
回答已采纳
1
回答
如何在
使用
drop
_duplicates (
Pandas
DataFrame)
时
获得掉行?
python
、
pandas
、
duplicates
、
drop-duplicates
我
使用
pandas
.DataFrame.
drop
_duplicates()删除所有
列
值
相同
的
行
的
重复项,但是对于数据质量分析,我需要生成一个带有删除
的
重复行
的
DataFrame。如何识别要删除
的
行?我想到了比较原始
的
DF
和没有重复
的
新
的
DF
,并识别
缺少
的
唯一索引,但是有更好
的
浏览 10
提问于2020-07-06
得票数 1
回答已采纳
1
回答
熊猫:根据阈值标准删除
列
python
、
excel
、
pandas
、
numpy
、
dataframe
我必须解决这个问题:目标:删除
列
,其中大多数行
缺少
输入,:1. Dataframe :
Pandas
2.阈值:确定哪些
列
将被删除。如果阈值为.9,则90%缺失值
的
列
将被删除输出:1.带删除
列
的
Dataframe (如果没有删除
列
,则返回
相同
的
数据) class variableTreatment():def
drop
_nan_col(self,
df</
浏览 4
提问于2019-11-13
得票数 0
回答已采纳
1
回答
如何获取两个数据帧之间
的
相关
值
python
、
sql
、
pandas
、
dataframe
数据帧A具有a_id
列
,数据帧B具有b_id
列
和b_value
列
。如何在a_id = b_id上加入A和B,并获得具有id和max(b_value)
的
C?
浏览 6
提问于2020-11-28
得票数 0
1
回答
如何清除
pandas
中
与所有行合并
的
名为"Unnamed“
的
行?
python
、
pandas
我想处理这个数据集,但正如您在图像中看到
的
,我在索引之前看到了一个未命名
的
行。但是,当我检查第一行以删除它
时
,我发现它与dataFrame
中
的
索引
中
的
数据有些合并。所以我试着删除第一行,但它仍然与下一行合并,然后我搜索所有行,它在所有行
中
。对如何摆脱它有什么想法吗?任何帮助都是非常感谢
的
。代码和输出如下: 数据帧头
的
片段,包括“未命名”行
df
.iloc[0] 2834897563
浏览 59
提问于2021-04-16
得票数 1
1
回答
如何在保存到拼花文件
时
使用
新
的
Int64熊猫对象
python
、
google-bigquery
、
parquet
、
pyarrow
我正在
使用
Python (
Pandas
)将数据从CSV转换为Parquet,以便稍后将其加载到Google BigQuery
中
。我有一些包含缺失值
的
整数列,由于
Pandas
0.24.0,我可以将它们存储为Int64 dtype。 是否有一种方法也
使用
Int64
的
dtype在一个拼花文件?对于
缺少
值
的
ints,我找不到一个干净
的
解决方案(因此它们在BigQuery中保持为整数)。我已经尝试将它直接导入到BigQuery
浏览 1
提问于2019-06-03
得票数 10
回答已采纳
2
回答
为什么在比较两个数据帧时会得到不同
的
结果?
python
、
pandas
、
dataframe
、
comparison
我正在比较两个
df
,当我
使用
.equals()
时
,它给了我False,但是如果我将两个
df
附加在一起并
使用
drop
_duplicate(),它不会给我任何东西。有人能解释一下吗?
浏览 2
提问于2019-10-22
得票数 1
1
回答
将系列列表串联到uid
中
。
python
、
python-2.7
、
pandas
、
pytest
我有一个
Pandas
数据框架,它包含几个
列
,这些
列
一起构成了唯一
的
标识符。我想编写一个通用
的
测试用例,它允许我将这些
列
连接到一个单独
的
列
(uid)
中
,并测试该
列
的
唯一性。我有以下代码作为
非
通用测试用例:import pytest
df
= pd.DataFrame(columns=['one
浏览 1
提问于2015-06-16
得票数 1
回答已采纳
1
回答
更改
DF
的
列
格式,其中某些
列
是块
python
、
pandas
、
dataframe
、
python-requests
下面我描述了我
的
DF
,我需要改变它。AMA'}]15 [{'id': 4, 'name': 'Exchange'}] I需要更改
列
"需要更改
列
“硬币”:将键提取为单独
的
列
并将它们
的
值放在那里。,我需要更改
列
“
浏览 1
提问于2022-07-13
得票数 -1
1
回答
如何将分类数据编码到标签中进行培训和测试
python
、
pandas
、
machine-learning
、
scikit-learn
培训数据集有名为shop和其他
的
对象
列
。现在,对于机器学习模型,我将
列
转换为用于培训目的
的
标签。
使用
下面的代码X =
df
_all_4.copy()for c in
df<
浏览 4
提问于2020-07-10
得票数 0
2
回答
当我需要
时
,Dask
drop
()不会丢弃
列
python
、
pandas
、
dask
我是新来
的
达斯克,
列
被删除
的
方式让我感到困惑。我已经把一个csv文件读到了Dask数据文件
中
。那么假设我有这个:print(len(list(
df
.columns))) # The Dask columnsbefore the
drop
df
.
drop
(columns_to_
drop
, axis=1).compute().
浏览 1
提问于2021-12-14
得票数 2
回答已采纳
2
回答
每个Dask Dataframe
列
中
的
唯一值数
python
、
dask
我有一个名为train
的
Dataframe,它是从一个大型CSV文件中加载
的
,我想在每一
列
中计算唯一值
的
数量。num = train[col].nunique().compute() print(line)Dask
浏览 2
提问于2020-12-27
得票数 0
回答已采纳
1
回答
如何在dataframe
中
查找值并
使用
python/
pandas
返回匹配值?
python
、
pandas
、
merge
、
lookup
我有两个大
的
数据帧,
df
1和
df
2。我在
df
2
中
缺少
一
列
(colB),我想根据共享
列
(colA)
中
的
值添加该
列
。如果我
使用
的
是Excel,我会通过一个标准
的
vlookup公式来做这件事,但是我正在努力
使用
pandas
合并函数来获得想要
的
结果。colA和colB都包含具有
相同
值
浏览 5
提问于2021-06-11
得票数 0
回答已采纳
4
回答
Python
Pandas
Drop
Dataframe
python
、
python-3.x
、
pandas
、
dataframe
、
data-science
如何从DataFrame
中
删除
列
?我知道这些数据是不可重现
的
,因为我有一个CSV文件,我正在尝试建立一个熊猫数据框架来做一些争论。import
pandas
as pdimport matplotlib.pyplot as plt
df
= pd.read_csv('C:\LoadProfilesKW(ch: 1 set:0) (这是我想要重命名为"kW“并做一些处理
的
数据……) 如果我尝试下面的代码:
df</em
浏览 44
提问于2017-12-08
得票数 3
回答已采纳
2
回答
如何
使用
python大熊猫删除csv
列
中
的
精确副本
python
、
pandas
、
dataframe
、
csv
、
duplicates
所以我正在做一些基本
的
数据处理。在'updated_at‘
列
中
,我得到了多次显示
的
相同
值。除了一个之外,我如何删除所有这些内容?希望这张照片能帮上忙。如果你们需要更多
的
澄清请告诉我。
df
=
df
.set_index("updated_at") new_
df
=
df
.where(~
df
.apply(pd.Series.duplicated, 1), "&qu
浏览 3
提问于2021-12-09
得票数 0
回答已采纳
1
回答
使用
Dask在Dataframe
中
删除高度
相关
的
成对特性?
python
、
pandas
、
dask
很难找到这方面的一个例子,但是如果
相关
阈值超过0.99,我想
使用
Dask删除成对
的
相关
列
。我不能
使用
Pandas
的
correlation函数,因为我
的
数据集太大了,而且它很快就占用了我
的
内存。,在所有
列
中
以迭代
的
形式执行,尽管它实际上可以运行它,而不会遇到内存问题。我已经阅读了,并了解了如何
使用
Dask 删除
列
,但在解决这个问题
浏览 1
提问于2020-07-08
得票数 3
回答已采纳
2
回答
Pandas
数据透视表值循环
python
、
pandas
我有一个数据集,其中包含特定日期(d1、d2、d3等)
的
日期和数据点。每个国家/地区
的
每种股票。每个国家
的
一些股票
缺少
一些数据点,我想用其他国家
的
股票
的
平均值来替换它们。corp 3 4 12 US12.94 abc corp NaN 3 4 CA如果有任何关于如何做到这一点<em
浏览 12
提问于2017-08-19
得票数 1
2
回答
谁能帮我理解一下.index在这段代码
中
做了什么?
python
、
pandas
、
indexing
我有以下代码: print(
df
.
drop
(
df
[
df
['Quantity'] == 0].index).rename(columns={'Weight': 'Weight (oz.)'})).index在这个特定
的
代码
中
做了什么? 对于上下文,这里是数据帧
的
样子: ? 我查看了有关dataframe索引
的
python文档: https://
pandas
浏览 47
提问于2019-10-02
得票数 0
1
回答
变量用于不同任务
时
的
Python内存
使用
情况
python
、
memory-management
我正在与
pandas
在ETL管道
中
工作,并且我正在超出我
的
计算机
的
内存
使用
量。我正在阅读Python
中
的
内存
使用
情况,当我创建一个
pandas
Dataframe
时
,我不明白内存
使用
是如何工作
的
,我为这个Dataframe指定了一个名称,并且我
使用
相同
的
名称进行一些转换或向其中添加更多
列
例如:
df</
浏览 1
提问于2020-11-23
得票数 0
1
回答
导入文本到
pandas
数据帧,
使用
shift,执行操作,保存到文本
python
、
pandas
我有一个两
列
135001行
的
文本文件。第一
列
是振幅,第二
列
是
相关
时间。我想保存文件
中
的
一些行,这些行
的
振幅从零变为
非
零。为此,我
使用
了一种想法,即当我
使用
一个小
的
简单数据(我在代码中产生数据)测试代码
时
,它工作得很好,但
使用
我
的
原始数据就不能工作。也许问题与读取数据有关。我拥有的简单数据如下:2 121
浏览 6
提问于2019-07-31
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
4个解决特定的任务的Pandas高效代码
每天读一本:利用Python进行数据分析
开启机器学习的第一课:用Pandas进行数据分析
Pandas与SQL的数据操作语句对照
处理缺失值的三个层级的方法总结
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券