腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
我
得到
额外
的
零
,
而
OneHotEncoding
分类
数据
?
python
、
scikit-learn
、
one-hot-encoding
直接来自Udemy上
的
机器学习课程,关于编码
分类
数据
的
讲座提供了一个CSV文件来进行编码。该文件
的
内容相当简单: ? 通过创建特征矩阵,
我
可以相当容易地获得
数据
。但是在使用sklearn (通用转换器)中
的
OneHotEncoder时,"country“列被分成3个不同
的
列,其值如下所示: ? 然而,讲师对相同
的
数据
和相同
的
代码只有一位小数。
我
似
浏览 17
提问于2021-04-23
得票数 0
回答已采纳
1
回答
如何保留Scikit-学习从模型生成到使用新
数据
的
OneHotEncoding
?
python
、
scikit-learn
、
one-hot-encoding
我
使用
OneHotEncoding
来生成一个
分类
问题
的
假人。当使用训练
数据
时,
我
得到
了300多个虚拟列,这是很好
的
。但是,当我输入新
数据
(行数较少)时,
OneHotEncoding
只生成大约250个虚拟
数据
,考虑到较小
的
数据
集,这并不奇怪,但由于功能不对齐,所以不能将新
数据
与模型一起使用。是否有一种方法可以保留用于新传入
数据
<e
浏览 4
提问于2020-05-05
得票数 0
回答已采纳
1
回答
TypeError:'OneHotEncoder‘对象不可迭代
scikit-learn
、
one-hot-encoding
我
试图在以下
数据
集
的
分类
变量上使用
OneHotEncoding
。 首先,
我
正在尝试转换“地理”专栏。以下是
我
迄今所做
的
工作:from sklearn.compose import ColumnTransformerOneHotEncoder(categories='auto'),[1]],remainder='passt
浏览 2
提问于2021-11-17
得票数 1
回答已采纳
2
回答
在对
分类
输入进行一次热编码时,如何处理神经网络
的
不同输入大小?
neural-network
、
categorical-data
让我们假设一个输入
数据
集,它是
分类
值和实值
的
混合。当将这些
数据
预处理为适当
的
NN输入时,OHE是推荐,因为它不考虑类别的任何顺序。“男人”、“女人”、“多样化”没有它
的
顺序,所以在一个维度中有一个表示它们
的
输入是没有意义
的
。 当使用交叉验证时,
数据
集通常被分割成一个小得多
的
子集。这些子集可能不包含所有类别。这可能导致网络
数据
输入
的
不可预测
的
列计数。它也会导致不同类
浏览 0
提问于2019-01-02
得票数 0
1
回答
如何将未知
数据
转换为能够在模型上进行预测?
python
、
one-hot-encoding
我
正在开发一个贷款状态检测器,并且一直在使用
OneHotEncoding
对一些
分类
列进行编码。
我
从X是11变成了X是17。
我
现在正在未知
数据
上测试
我
的
模型,使用11个变量
的
新
数据
帧,使用编码器对其进行拟合转换,
我
假设结果是17列
而
不是11列。但是
我
得到
一个错误,说模型需要17个变量。
浏览 27
提问于2020-07-15
得票数 0
5
回答
与
oneHotEncoding
的
问题
python
、
scikit-learn
、
preprocessing
因此,
我
在一个列中有一个带有
分类
变量
的
PandasDataFrame,
我
想对它进行一个热编码,
我
使用了来自ML课程
的
以下代码Y= onehotencoder.fit_transform(X).toarray() 但是,
我
得到
以下错误ValueErro
浏览 0
提问于2017-10-18
得票数 8
3
回答
MinMaxScaler :
我
也应该规范化类标签吗?
python
、
machine-learning
、
scikit-learn
、
deep-learning
我
使用
的
是MLPRegressor,它采用5个连续
的
特征和1个特征,它从一组40个值
的
[0,1,2,.., 39]中提取值。有人告诉
我
,使用sklearn.preprocessing.MinMaxScaler(feature_range = (0,1))对这些特性进行标准化可以帮助提高性能,无论是使用MLP还是LSTM。因此,
我
在包含上述特性
的
Xtrain矩阵上使用它。 然而,对于我来说,
我
应该最小化一个
分类
变量,这看起来很奇怪。<e
浏览 1
提问于2017-10-16
得票数 1
2
回答
预测哪种药物对哪个病人最合适,准确率几乎为0。
classification
、
scikit-learn
我
有一个像这样
的
数据
文件: 'sex': [0, 1, 1, 0], 'disease_type': ['真正
的
df有> 10000行(=病人)和34种不同
的
药物,但似乎
我
不能在这里上传一个csv作为一个更有用
的
例子?根据患者
的
年龄、性别、疾病类型和疼痛减轻程度,
我
浏览 0
提问于2020-10-15
得票数 2
2
回答
在预测过程中如何处理测试
数据
一次编码后
的
类别不匹配?
python
、
machine-learning
、
scikit-learn
、
data-science
很抱歉,如果问题
的
题目不那么清楚,
我
不能用一句话来概括这个问题。 以下是用于解释
的
简化
数据
集。基本上,培训集中
的
类别数比测试集中
的
类别数大得多,因此测试集中
的
列数与
OneHotEncoding
后
的
培训集中
的
列数有差异。
我
该如何处理这个问题?之后
的
培训集是形状(3,4),
而
OneHotEncoding
后
的
测试集是形状(3,3)。(
浏览 4
提问于2017-12-13
得票数 5
回答已采纳
2
回答
Logistic回归输出中概率
的
两个不同值
r
、
classification
、
probability
、
logistic-regression
、
glm
我
在R中运行一个logistic回归,并使用以下方法提取大约15,000行测试
数据
的
预测概率
我
本来希望
得到
0到1之间
的
各种概率值,但却只有两个不同
的
概率值。所有概率要么是1,要么是2.220446e-16 (实际上等于
零
)。实际上,
我
得到
的
是二进制
分类
,
而</em
浏览 0
提问于2018-04-14
得票数 0
回答已采纳
7
回答
有约束
的
多对一建模?
sql-server
、
database-design
、
sql-server-2008
、
normalization
、
referential-integrity
我
正在尝试为电影
分类
创建一个
数据
库模型,其中每部电影都可以从多个分级系统(例如BBFC、MPAA)中
的
每一个
得到
一个单独
的
分类
。,
而
理想情况下,它应该只允许来自给定系统
的
零
分类
或一个
分类
。是否有任何合理
的
方法来重构这一点,以便在满足以下要求
的
情况下,使来自任何给定系统
的
完全为
零
或一个
分类
<em
浏览 4
提问于2010-05-10
得票数 3
2
回答
使用
分类
预测器在SAS中执行hpgenselect
sas
、
lasso-regression
我
正在使用这里使用logistic 分析
的
神经痛
数据
集运行具有二进制端点
的
套索回归。
我
运行以下代码 class Treatment Sex;output out=predLASSO pred=Lpred pzero=Lzero;然而,与proc logistic相反,对于二进制性别等<e
浏览 7
提问于2020-12-01
得票数 1
1
回答
为什么
SciKit-学习
的
OneHotEncoder在大型
数据
集上花费这么长时间?
scikit-learn
、
one-hot-encoding
、
efficiency
我
正在使用一个较早版本
的
SciKit,1.0.2版本,尝试并OneHotEncode一些
数据
。
我
的
数据
集相当大,184个列将在
OneHotEncoding
之后转到311列,有大约50万行。尽管如此,
我
相信我可以立即编写最大限度
的
OneHotEncodes列代码。 目前,SciKit-学习
的
OneHotEncoder是10分钟和计数。
为什么
这段代码这么慢?
我
能做些什么来加速这一切吗?
浏览 0
提问于2022-11-29
得票数 1
回答已采纳
2
回答
对于我
的
CNN模型,
我
应该如何解释或直观地解释以下结果?
python
、
tensorflow
、
machine-learning
、
keras
我
正在训练一个CNN模型,它需要对4个物体进行
分类
。3个杯子(白色,黑色,蓝色)和1个玻璃杯。当我训练
我
的
模型只有10个时代,
我
得到
了25%
的
验证准确性,其中所有的东西都被标记为白色杯子。换句话说,如果
我
能够找到
为什么
我
的
分类
器错误地
分类
白色杯子,那么
我
可能达到90%
的
validation_accuracy。因此,
我</
浏览 4
提问于2020-05-28
得票数 1
2
回答
微调预培训
的
word2vec Google新闻
python
、
gensim
、
word2vec
、
google-news
、
fasttext
我
目前使用
的
Word2Vec模式是在谷歌新闻语料库上培训
的
(来自),因为这是直到2013年才对新闻进行培训
的
,因此
我
需要更新矢量,并根据2013年以后
的
新闻在词汇表中添加新单词。假设
我
在2013年后有了一个新
的
新闻语料库。
我
可以重新培训或微调或更新谷歌新闻Word2Vec模式吗?能用Gensim做吗?可以用FastText来完成吗?
浏览 4
提问于2017-09-15
得票数 3
1
回答
为什么
我
要在cv循环中进行目标编码?
cross-validation
、
overfitting
、
categorical-encoding
、
target-encoding
我
希望使用目标编码,使用类别编码器学习库。
我
真的不明白
为什么
有必要在交叉验证循环中将其作为sklearn管道中
的
一个步骤吗?然而,看看我下面的结果,这不说明是否过份合适吗? 📷
浏览 0
提问于2020-12-07
得票数 0
1
回答
如何使用一热编码
python
、
scikit-learn
、
jupyter
、
jupyter-notebook
我
一直在用谷歌来尝试和理解,但我就是无法理解。
我
的
问题如下。 现在,我们也要使用
分类
功能!因此,我们必须对
分类
特性执行
OneHotEncoding
。为此,应将每个
分类
特性替换为功能表中
的
虚拟列(每个类别特性
的
可能值为一列),然后以二进制方式对其进行编码,以便最多只有一个虚拟列一次可以接受“1”(其余列为
零
)。但是现在
我
不得不用这个热编码来处理灾难性
的
东西,但是
我
完
浏览 5
提问于2016-10-16
得票数 0
回答已采纳
2
回答
Python/ML:用于产品
分类
的
多类
分类
使用哪些方法?
python
、
machine-learning
、
neural-network
、
classification
、
multiclass-classification
我
有一个有>100000个观测值
的
数据
集;
数据
集
的
列包括CustomerID、VendorID、ProductID和CatNMap。如下所示:如您所见,在前3列(CustomerID、VendorID、ProductID)中表示
的
值表示唯一
的
数值映射值,如果在x,y平面上表示(这消除了许多
分类
方法
的
使用),则没有意义;最后一列包含由客户分配
的
类别字符串现在,这是
我
不明白
的<
浏览 8
提问于2020-02-11
得票数 5
1
回答
如何测试WEKA
的
分类
数据
集?
weka
我
有一个大
数据
集,其中包含作为文本
的
最后一个属性类标签。
我
把“?”这个班
而
不是最后一个属性中
的
类,
我
想预测它。
为什么
混淆矩阵输出
零
和实例总数等于
零
?
我
选择‘更多
的
选项’,
浏览 1
提问于2014-11-01
得票数 0
2
回答
Linux套接字传输正在添加
额外
的
零
填充。
linux
、
sockets
、
tcp
、
padding
当我试图通过TCP将
数据
从Linux客户端发送到Server时,
我
看到
数据
中添加了
额外
的
零
。谁能让
我
知道
为什么
我会
得到
这些
额外
的
零
?请参阅下面的
数据
包格式。
浏览 2
提问于2015-08-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于CPPN与GAN+VAE生成高分辨率图像
深度神经网络之正则化
在神经网络中,数学是如何发挥巨大作用的?
在构建神经网络中,数学有多重要?
深入浅出机器学习技法(一):线性支持向量机(LSVM
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券