腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
数据
集
替换
使用
Python
或
pandas
的
另一个
数据
集中
的
值
、
、
、
、
我有一个巨大
的
数据
集
'A‘,用于汽车
的
价格预测,其中包含某些列。其中一列是“城市”,我想给每个城市排名,以便将其用于ML算法。这些城市超过50个,所以在运行时
替换
并不会使代码看起来很好。我想创建一个包含“城市”和“排名”
的
.csv,并
替换
和
使用
数据
集
“A”中
的
“排名”。我如何在
python
或
pandas
中做到这一点?任何示例
或<
浏览 24
提问于2019-10-26
得票数 0
1
回答
PYTHON
:
使用
熊猫库将转换
的
连续属性(转换为分类)附加到原始
数据
集中
、
我对
python
很陌生,我想用熊猫库来实现朴素
的
Bayes分类器。为此,我希望将所有连续属性转换为范畴属性,反之亦然。现在,我将连续属性转换为方法。我
使用
了等宽
的</
浏览 1
提问于2015-04-05
得票数 1
回答已采纳
4
回答
在
Python
数据
集中
只保留每行
的
最低
值
、
在
Pandas
数据
集中
,我只想保持每行
的
最低
值
。所有其他
值
都应删除。我需要完整
的
原始
数据
集
。只需删除不是最小
值
的
所有
值
(用NaN
替换
)即可。谢谢罗伯特
浏览 2
提问于2014-11-11
得票数 1
回答已采纳
1
回答
是否有一个
python
函数可以在时间序列
数据
集中
找到一行中多个相同
的
值
?
、
、
、
我正在处理2020年每分钟汇总
的
大型时间序列
数据
集
。该
数据
集
是从监测热电厂设备
的
传感器获取
的
值
。传感器测量温度、压力、电流等值,并在每次读数时更新
数据
集
。 我希望检测由传感器引起
的
数据
集中
的
错误。当来自传感器
的
输入被固定在某个
值
上时,来自传感器
的
一种错误类型发生。例如,其中一个温度传感器连续2
浏览 37
提问于2021-01-26
得票数 0
1
回答
用于提供类别概率统计信息
的
SAS操作
我有一个名义
值
的
向量,我需要知道每个名义
值
出现
的
概率。基本上,我需要它们来获得观察到标称
值
的
概率
的
min, max, mean, std,并获得Class Entropy
值
。例如,假设有一个
数据
集
,其中目标预测0、1
或
2。在训练
数据
集中
。我们可以计算目标为1
的
记录
的
数量,并将其称为n_1,类似地,我们可以定义n_0和n_2。然后
浏览 15
提问于2020-02-12
得票数 0
回答已采纳
1
回答
获取训练和测试
数据
的
假人
我是否应该将pd.get_dummies()应用于培训和测试
数据
?会不会导致
数据
泄漏?
浏览 0
提问于2022-01-08
得票数 1
1
回答
如何准备熊猫
的
纵向
数据
,然后从学习算法中
使用
?
、
、
我正在
使用
Pandas
清理和准备我
的
数据
集
,以供学习算法
使用
,例如用于分类
的
随机森林或用于聚类
的
K-means。我曾经有过这样
的
数据
集
(举例说明):然而,在我
的
数据
集中
,我面对
的
是一种不同
的
类型:纵向
数据
,如下图所示:正如您所看到
的
,对于每个单独<em
浏览 3
提问于2015-03-29
得票数 1
2
回答
如何在R中加速tryCatch函数?
、
我正在尝试从R中
的
模型预测测试
数据
集
,因为缺少一些因素,所以我想在创建输出时只跳过
或
替换
这些因素。
替换
该
值
,甚至
使用
另一个
模型。问题是,这需要永远
的
时间。我有一个6米长
的
数据
集
,它看起来需要大约7天
的
时间才能运行(基于较小
数据
集
的
计算)。运行同样
的
命令只需要不到一个小时<em
浏览 1
提问于2014-09-14
得票数 3
1
回答
如何
使用
熊猫dataframe向基于
另一个
df中匹配列
的
数据
标记为1
或
0
的
dataframe添加列
、
、
我正在为机器学习算法标记一些医疗保险
数据
集
,
使用
Pandas
数据
作为欺诈性
或
非欺骗性
数据
。标签包括将DMPOES
数据
集中
的
NPI编号与LEIE
数据
集中
的
NPI编号相匹配。每个
数据
集
都包含一个名为"NPI“
的
列。我需要能够找出DMEPOS
数据
集中
的
每
浏览 4
提问于2021-03-28
得票数 0
3
回答
在SAS上,合并、追加和合并有什么区别?
我试图在SAS上运行代码来连接、追加和合并,但无法理解它们之间
的
区别。寻找一些人来帮助我理解同样
的
例子。
浏览 3
提问于2016-03-23
得票数 0
2
回答
如何处理
数据
集中
的
缺失
值
、
、
我有一个简单
的
分类问题,我正试图通过
使用
keras
的
神经网络来解决这个问题。有一个数值
数据
集
,大小为26000 *17。但问题是,
数据
集中
有很多缺失
值
(空
值
)。
数据
是非常敏感
的
,所以我既不能忽略所有包含空
值
的
行,也不能用average、mean
或
任何标准数字
替换
数据
中
的
空
值
。
浏览 0
提问于2018-12-27
得票数 4
1
回答
比较变量
的
水平
是否有方法将
数据
集中
的
变量级别与
另一个
数据
集
进行比较,以检查编码是否已更改?寻找一种在R
或
Python
中实现这一功能
的
方法。谢谢!编辑:我正在寻找一种方法来寻找
数据
集
编码中
的
差异(例如,变量可以采取
的
变量/
值
的
级别-它们是否报告不同)。我想用
Python
或
R来做这件事,我希望这能澄清
浏览 2
提问于2022-03-23
得票数 -1
2
回答
Pandas
:如何拆分和读取值
、
在我
的
数据
集中
,有一列包含学生选修
的
课程
的
名称。它有多个
值
我
的
数据
集
是这样
的
:current dataset 我希望将其更改为如下所示
的
数据
集
:wantDatasetLikethis 我希望将这些
值
(课程名称)分开,分别为每门课程创建列,并根据学生所选
的
课程分配
值
1
或
0。我如何
使用<
浏览 23
提问于2021-09-28
得票数 0
回答已采纳
1
回答
ValueError:输入包含NaN、无穷大
或
对于dtype('float64')来说太大
的
值
。如何处理这个错误?
、
、
、
、
首先,在
数据
集中
,我
使用
均值策略将所有缺少
的
值
替换
为计算机类,但它已将其
替换
为
数据
集中
的
大
值
,这导致了此错误。这个问题
的
解决方案是什么,或者我如何将
值
四舍五入到小数点后两位。由于
数据
集
包含浮点
值
,将它们四舍五入到小数点后2位
或
3位对我来说是可行
的
。代码: import num
浏览 9
提问于2020-06-09
得票数 1
回答已采纳
2
回答
使用
替换
对R中
的
数据
帧
的
随机行进行采样
、
、
我希望能够
使用
bootstrapping为一些测试统计
数据
生成一些置信区间。我希望能够做
的
是
使用
原始
数据
集
的
采样和
替换
来绘制引导
数据
集
。我假设这将是一个大小为n
的
数据
集
(其中n小于原始
数据
集
的
大小),它从具有
替换
的
完整
数据
集中
采样观察<em
浏览 0
提问于2018-09-11
得票数 0
1
回答
通过检查大熊猫中
的
条件动态创建列
、
我有如下所示
的
数据
集
:它需要根据下面的master
数据
集
进行检查:这里
的
条件是检查Group及其
值
与主
数据
集
的
关联
值
,并从主
数据
集中
选择S2SFlag列
值
,并在
数据
集中
创建S2SFlag通过
使用
AWS Lambda查询
数据
库返回原始
数据</em
浏览 4
提问于2022-02-08
得票数 0
回答已采纳
1
回答
如何比较列子集上
的
两个
数据
格式之间
的
所有行匹配?
、
、
、
、
我有两个
数据
集
,input和output,在输入上进行了一些
数据
转换,以获得结果输出,其中没有。对于具有列标题
的
行和列,则保持不变。我需要比较并确保所有非转换(58)列
的
输入和输出之间
的
所有行和列
数据
匹配(忽略两个转换
的
列)。到目前为止,我所做
的
(<em
浏览 0
提问于2021-02-02
得票数 0
1
回答
大量
数据
,试图在一列中
替换
分隔符字符,但不是所有分隔符字符。
、
、
、
、
我试图用
Pandas
分析一个
数据
集
(200 by,~3mil行),但是这个
数据
集
包含一个由随机用户填充
的
列,其中允许所有字符。这造成了分隔符字符(\t)也经常出现在最后一列中
的
问题。在GVIM中,我尝试搜索和
替换
所有的'\t's,但是这也取代了实际
的
分隔符(在GVIM中没有显示)。有没有人知道如何在大
数据
集中
的
某一列中具体
替换
字符?例如,我所拥
浏览 8
提问于2016-04-11
得票数 2
回答已采纳
1
回答
训练和测试
数据
集
作为4个不同
的
数据
集
给出
、
我是
python
的
新手,非常希望能得到一些帮助。
数据
集
如下:我将非常感谢任何建议
或
解决方案。
浏览 0
提问于2019-10-15
得票数 0
1
回答
如何为给定列添加行和
值
?
、
、
因此,我现在有以下DataFrame,其
值
如下:+-------+--------++-------+--------++-------+--------+ 其中时间没有
值
(或为空)。稍后,我将在我
的
程序中添加更多
的
行,并且需要为
值
和时间列添加/追加值。我该怎么做?
浏览 5
提问于2017-06-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用 Python 完成数据分析(3):Pandas的使用
使用Pandas读取复杂的Excel数据
我这有个数据集,想取出每天每个国家确诊数量前30的数据,使用Pandas如何实现?
使用 Pandas resample填补时间序列数据中的空白
Python数据分析入门日记Day9:数据分析库Pandas:缺失值的处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券