腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
python
中
的
比率
来
填充
缺失
的
性别
数据
?
python
、
pandas
、
data-analysis
、
missing-data
我想要在
数据
集中按比例
填充
缺少
的
性别
数据
。我
使用
布尔索引和头部或尾部函数来选择我想要
的
顶部
数据
,但当我
使用
fillna函数时,它在我尝试后没有work.but,它只在没有布尔索引
的
情况下运行,我
如何
才能获得示例
中
的
前3个空值并用0
填充
它。reshape((10,5)))a[0][a[0].isn
浏览 20
提问于2019-05-17
得票数 0
回答已采纳
1
回答
Python
机器学习-输入分类
数据
?
python
、
scikit-learn
、
modeling
、
imputation
我正在
使用
Python
学习机器学习,我明白我不能通过模型运行分类
数据
,而且必须首先获得虚拟
数据
。我
的
一些分类
数据
有空(只有两个特性
中
的
很小一部分)。当我转换为虚拟,然后看看我是否有
缺失
的
值,它总是没有显示。我应该事先推断一下吗?还是我把所有的分类
数据
都算出来了?例如,如果类别是男/女,我不想用most_frequent替换空。我明白,如果功能是收入,这会有什么意义,我会把
缺失</e
浏览 4
提问于2017-09-27
得票数 1
回答已采纳
1
回答
在
Python
语言中
使用
MICE算法时
的
TypeError
python
、
imputation
、
fancyimpute
我正在尝试在我
的
数据
集中
填充
缺失
的
数据
,我
的
导师建议我
使用
Python
中
的
Fancy Impute包,特别是MICE算法。首先,当我读到关于MICE
的
文章时,很明显,如果我
的
缺失
数据
不是随机
的
(我对此表示怀疑,因为
缺失
数据
更有可能出现在特定
的
国家/
浏览 5
提问于2017-09-14
得票数 0
3
回答
用什么预测模型
来
推断
性别
?
predictive-modeling
、
missing-data
、
data-imputation
我
的
数据
如下:birth_date缺少634,990个值 由于我有900 k项,这两项都是相当大
的
数量,所以我不能丢弃空行。对于birth_date,有人建议
使用
链式方程(小鼠)
的
多变量计算。我不知道我应该为gender
使用
什么预测模型。在未缺少
的
数据
中
,男性比女性多5倍。 谁能告诉我这里最好
的
做法是什么?
填充
gender
缺失
值
的
浏览 0
提问于2019-05-07
得票数 5
回答已采纳
1
回答
替换所选
的
数据
python
、
pandas
我试图清理
数据
集,
填充
缺失
的
值等等。我注意到,对于“
性别
”,有些值是
缺失
的
,而不是用最常见
的
值
来
填充
缺失
的
值,我想用男女比例
来
填充
缺失
的
值。下面的内容不起作用,但与我目前所得到
的
结果一样接近。'][:1000].replace('NA', 'F
浏览 2
提问于2021-08-20
得票数 1
回答已采纳
3
回答
部分未知向量
的
最近邻
algorithm
、
machine-learning
、
similarity
、
data-science
、
nearest-neighbor
特征向量有3项[weight, height, age],在我们
的
列表中有3人。注意,,我们不知道人
的
身高C,。, 50y]我猜现在
的
问题是,我们把C和猜测
的
~170cm放在一起,而把B放在已知
的
169cm上。 感觉有点不对劲。我们人类比机器聪明,并且知道C完全是170cm
的
可能性很小。,但是我们
如何
计算这个惩罚呢?(最好
浏览 4
提问于2017-09-23
得票数 1
2
回答
如何
在时间序列
数据
中
引入
缺失
值
python
、
dataframe
、
time
、
time-series
、
nan
我是
python
的
新手,也是这个网站
的
新手。我和我
的
同事正在处理一个时间序列
数据
集。我们希望向
数据
集引入一些
缺失
值,然后
使用
一些技术
来
填充
缺失
值,以查看这些技术在
数据
填充
任务
中
的
执行情况。我们目前面临
的
挑战是
如何
以连续
的
方式向
数据
集引入
缺失
浏览 2
提问于2020-11-17
得票数 0
4
回答
数据
中
缺失
的
值
data-mining
、
dataset
、
data-cleaning
、
data
、
missing-data
我曾经经历过,大多数
数据
集都包含
缺失
的
值,这使我们
的
任务变得有些困难。 请让我知道
如何
有效地
填充
那些
缺失
的
值?是否有任何特定
的
技术来处理丢失
的
值?
浏览 0
提问于2017-08-31
得票数 5
回答已采纳
2
回答
如何
使用
左列
的
数据
作为引用来
填充
do?
pandas
、
join
、
merge
、
lookup
我想要在修复熊猫
数据
中
丢失
的
值方面寻求帮助(
python
)在这个
数据
集中,我在'Item_Weight‘列中找到了一个
缺失
的
值。我不想删除丢失
的
值,因为我是通过对它们进行排序
来
发现
的
。缺少
的
值是编码它的人
的
“想念类型”。现在,我创建了一个查找
数据
集,以
浏览 7
提问于2022-07-06
得票数 0
回答已采纳
1
回答
Python
熊猫用另一个变量
的
模式
填充
一个变量
的
缺失
值。
python
、
pandas
、
dataframe
、
missing-data
我希望用来自另一列
的
值
的
模式
来
填充
一列缺少
的
值。假设这是我们
的
数据
集(从Chris Albon借来
的
):import numpy as np df["postTestScore"].fill
浏览 0
提问于2018-06-01
得票数 0
回答已采纳
1
回答
如何
使用
Python
从javascript网页
中
抓取HTML
javascript
、
python
、
html
、
linux
、
screen-scraping
我试图解析html,以便从嵌套在标签
中
的
标签
中
获取
数据
,但当我美化时,我得到了javascript。
如何
从这个javascript
中
获取信息?
如何
将其转换为html?有没有更好
的
方法
来
获取这些信息?这是我
的
第一个问题,如果我犯了任何错误,我道歉。谢谢。这是我
的
代码:import requests html = request
浏览 0
提问于2020-06-29
得票数 1
3
回答
基于目标变量
的
缺失
值估算
scikit-learn
、
missing-data
我想在德国信用风险
数据
集中计算
缺失
的
值。False) NaN 183quite rich 63有近20%
的
数据
缺失
但是
如何
处理NaN值呢?我可以尝试用模式
来
填充
它们,并且模式是“小”。我还可以假设,该字段
中
的
NaN值意味着没有帐户(而且我可以用“很少”甚至“缺
浏览 0
提问于2023-02-13
得票数 4
1
回答
在
python
大熊猫
中
基于多个其他列创建具有
比率
值
的
新列
python
、
pandas
、
pandas-groupby
、
group
我是个
python
新手,在
如何
转换
数据
方面有点迷失了。下面是一个示例
数据
集:import pandas as pdrandom.seed(123)7 8 70 1 09 10 70 1 0 我想在dataframe
中
创建三个新列,它们表示不同变量之间
的
浏览 4
提问于2022-03-31
得票数 2
2
回答
处理多数类丢失
的
数据
classification
、
dataset
、
class-imbalance
、
missing-data
我正在
使用
一个不平衡(10:1)
的
数据
集进行分类。我还在某些列
中
丢失了一些
数据
。如果我把它们全部丢弃,我仍然有5:1
的
比率
,所以我想我有能力抛弃它们?丢弃缺少值
的
行,因为
数据
集已经不平衡。
使用
其余行进行欠采样。 很抱歉问你
浏览 0
提问于2021-12-18
得票数 1
1
回答
如何
在SPSS
中
对一个范畴变量进行单次估算?
spss
、
missing-data
我
的
主管确信,可以在SPSS
中
对某一类别变量
的
缺失
值进行单次估算:该变量
的
缺失
观测被随机分配给变量类别(级别),其分布与它们在非
缺失
观测
中
的
分布相同。所以,一个愚蠢
的
例子:我在8个观测中有一个二元变量(比如
性别
);这个变量在6个观测
中
没有
缺失
,在3个观测
中
是0=male (50%),在3个(50%)
中
是1=female;这个过程
浏览 3
提问于2015-11-03
得票数 2
回答已采纳
2
回答
python
中
类别变量
的
knn推算
python
、
machine-learning
、
knn
、
imputation
我正在尝试从
数据
集上
的
fancyimpute模块实现kNN。我能够
使用
下面的代码实现
数据
集
的
连续变量
的
代码:它产生如下所需
的
答案:我试图为分类
数据
集实现相同
的
代码,但我得到了错误: could not convert string to float: 'f
浏览 0
提问于2017-04-20
得票数 3
1
回答
使用
现有列
数据
的
计算来
填充
缺少
的
数据
missing-data
、
fillna
一列中有4个
缺失
值。而不是归因于平均值或中位数,可以
使用
现有列
数据
中
的
一个简单公式
来
计算。尝试用下面的公式albumin /(总蛋白-白蛋白)
填充
缺少
的
白蛋白球蛋白
比率
数据
,但是下面的代码总是出错。
浏览 17
提问于2020-04-28
得票数 0
2
回答
当组大小有显著差异时,评估一个组
的
度量是否高于另一个组
的
度量。
data-analysis
、
variance
、
hypothesis-testing
我正在
使用
一个
数据
集,其中包含申请者
的
收入、
性别
和贷款状况(无论此人是否已被批准贷款)。我根据这些
数据
创建了下面的图表。直方图图是:核密度估计(KDE)图是:KDE地块似乎表明,与妇女相比,在某一特定收入
中
,男子接受
的
与被拒绝
的
比率
更高。我想进一步调查一下。注(!)
数据
集中
的
男性多于女性,因此任何结论都需要考虑到差异。 一个想法:我最初
的
想法是把收入存起来,计算每个<e
浏览 0
提问于2022-01-23
得票数 0
回答已采纳
1
回答
如何
在
python
中
复制vlookup
来
填充
缺失
的
数据
?
python
、
vlookup
、
missing-data
我是
python
的
新手,需要一些帮助。我正在查看一个国家几个月
的
AirBnB
数据
,并注意到在随后
的
几个月中,源文件
中
的
一些字段尚未提取。我将所有月份
的
数据
附加在一起,
数据
框包含2018年8月至2021年1月
的
城市
数据
(2020年7月至2020年9月
缺失
/不可用)。我正在考虑在
python
中
使用
vlookup
的<
浏览 22
提问于2021-04-19
得票数 0
2
回答
预测丢失
的
数据
。寻找良好
的
数据
预测技术
data-mining
、
statistics
、
probability
、
data-science-model
、
data-analysis
我正在分析各国贸易国内生产总值
的
数据
。其中一些国家
的
GDP价值在给定
的
一年内一直处于
缺失
状态。不过,那一年我有整个地区
的
总金额。下面的例子是否有一个很好
的
数据
科学技术
来
填补国内生产总值
中
缺失
的
贸易。
浏览 0
提问于2019-01-04
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
仅需10分钟:开启你的机器学习之路
Python数据分析之pandas(三)
用pandas处理Excel
Python告诉你
Python时间序列数据清洗技巧与最佳实践
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券