腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
SciKit
学习
中
使用
相同
的
预
处理器
缩放
数据
帧
中
的
多个
列
、
、
、
在下面的
数据
框
中
,我希望
在
每个符号中
使用
相同
的
最小值和最大值来
缩放
Open、High、Low、Close。我可以用下面的代码做到这一点,但是有没有一种合理
的
方法来用
SciKit
Learn预
处理器
来实现这一点呢?
浏览 19
提问于2020-01-22
得票数 2
回答已采纳
1
回答
Python Bayes心脏预测,结果不准确
、
、
、
、
我试着用朴素
的
贝叶斯做一个心脏病预测程序。当我完成分类器时,交叉验证
的
平均准确率为80%,但是当我试图对给定样本进行预测时,预测是错误
的
!该
数据
集是来自UCI存储库
的
心脏病
数据
集,包含303个样本。有两类0:健康和1:病,当我尝试从
数据
集对样本进行预测时,它不会预测它
的
真实值,只有很少几个样本。预测值:1 我得到1而不是0(这个样本已经是
数据
集样本之一)。我做了一个以上
的
样本从
数据
集,我得到错
浏览 3
提问于2017-06-16
得票数 2
回答已采纳
2
回答
python (
Scikit
-Learn)和R (e1071)
的
不同精度
、
、
、
对于
相同
的
数据
集(这里是Bupa)和参数,我得到了不同
的
精度。我得到了准确性:0.94import numpy as npfr
浏览 1
提问于2015-11-16
得票数 4
2
回答
scikit
中
的
缩放
数据
-
学习
支持向量机
、
、
、
虽然libsvm提供了
缩放
数据
的
工具,但
使用
Scikit
-Learn (它应该基于SVC分类器
的
libSVM ),我发现没有办法
缩放
我
的
数据
。基本上我想
使用
4个特征,其中3个范围从0到1,最后一个是一个“大”
的
高度可变
的
数字。如果我
在
libSVM
中
包含第四个特性(
使用
easy.py脚本自动
缩放
我
的</e
浏览 5
提问于2012-11-11
得票数 13
回答已采纳
1
回答
如何
使用
不会随
scikit
而变化
的
中心来扩展
数据
??
学习
和python
、
、
、
、
我正在尝试扩展一个
数据
集,以训练一个
使用
python和
scikit
- learning
的
机器
学习
模型。我想
缩放
一个
数据
集,但是坚持所有负
的
原始值
在
缩放
后仍然是负
的
,而所有正
的
原始值
在
缩放
后仍然是正
的
。10.0]])#shou
浏览 5
提问于2022-11-25
得票数 0
回答已采纳
2
回答
使用
AWS SageMaker,是否有可能
使用
sagemaker部署经过预先培训
的
模型?
、
、
、
我试图避免将现有的模型培训过程迁移到SageMaker,并避免创建自定义
的
Docker容器来承载经过培训
的
模型。我
的
希望是将我们现有的、经过训练
的
模型注入到
预
建好
的
scikit
学习
容器
中
,这是AWS通过提供
的
。我发现
的
所有示例都需要首先对模型进行培训,这将在SageMaker
中
创建模型/模型配置。然后
使用
deploy方法进行部署。 是否有可能为deplo
浏览 1
提问于2019-02-28
得票数 8
1
回答
如何编写5折交叉验证
的
代码?
我有一个代码,用于将大小为351×14
的
数据
集dfXa拆分为10个折叠,并选择一个折叠用于大小为35×14
的
dfX_val表示
的
验证,并选择9个折叠用于大小为316×14
的
dfX_train
的
训练。但是如何才能得到一份5倍
的
简历呢?我想在不
使用
sklearn
的
情况下实现5倍
的
CV。
浏览 65
提问于2021-10-28
得票数 2
回答已采纳
1
回答
如何针对
缩放
数据
从非
缩放
数据
中
删除
数据
?
、
我现在
使用
的
是R,在这里,我正在
缩放
原始
数据
,删除所有Z分数为3或更多
的
离群值,然后过滤掉未
缩放
的
数据
,使其只包含非离群值。我希望
在
删除离群值后留下一个包含非
缩放
数字
的
数据
帧
。过滤掉在x中大于3Z得分
的
所有行 根据名为Row ID
的
唯一
列
浏览 2
提问于2017-07-25
得票数 0
回答已采纳
1
回答
使用
scikit
对
数据
进行
缩放
时
的
奇怪结果
、
、
、
我想要
的
是将这4个时间序列组合成簇
的
相似的日子分组。属于同一组
的
天数应具有类似的时间序列。
在
使用
k均值或Ward
的
方法对天进行聚类之前,我想
使用
scikit
学习
来扩展它们。为此,我必须将
数据
转换为形状为(80,4*288) = (80,1152)
的
二维形状数组,因为
scikit
学习
的
标准Scaler不接受三维输入。,例如第一天(1行)和第4次时
浏览 6
提问于2022-08-24
得票数 0
回答已采纳
1
回答
特性工程:不同发行版
的
缩放
、
、
、
、
我正在努力理解扩展我
的
特性
的
最佳方法,并
学习
如何
使用
SciKit
包在我
的
预测
数据
集上转换/匹配。第一组有正态分布,所以我只想用最小最大标度来
缩放
数值(正值
在
20-100之间)。第二组特征有异常值,所以我相信粗壮
的
定标器会给出更好
的
结果。可以
在
我
的
数据
集上
使用</
浏览 0
提问于2021-10-26
得票数 0
回答已采纳
2
回答
scikit
支持
在
[0,1]或[-1,1]之间
缩放
功能
、
、
scikit
learn
的
SVM是基于LIBSVM
的
。LIBSVM/SVM要求对
数据
进行
缩放
,建议特征值应在0,1或-1,1这两个范围
中
的
一个。也就是说,
在
典型矩阵
中
,每
列
都是一个特征,并且按
列
进行
缩放
。LIBSVM常见问题解答建议
使用
简单
的
缩放
来获取0,1之间
的
特征 x'=(x-min)&
浏览 2
提问于2012-10-04
得票数 3
回答已采纳
1
回答
基于文本
的
项目相似度
、
、
我们最初
的
方法是计算每个项目的TF-以色列国防军矢量。我们
使用
了一个带有5000种可能散
列
的
散
列
tf作为单词。然后用抽样技术(数字和)近似所有对. 我们有一个mxn矩阵,其中m是单词数,n是项目数。计算所有
列
余弦相似点
的
天真方法在这里是行不通
的
,因为我们有n=10^7 m=10^4。我们
的
第一次尝试是
使用
全对采样技术--韧窝和http://stanford.edu/~rezab/
浏览 0
提问于2015-07-28
得票数 7
2
回答
科学
学习
与滑雪板
的
区别
、
、
在
OSX10.11.6和python 2.7.10上,我需要从sklearn流形导入。我已经安装了numpy 1.8 Orc1,.13 Ob1和
scikit
-learn 0.17.1。我
使用
pip安装sklearn(0.0),但是当我尝试从sklearn流形导入时,我得到了以下内容: 追溯(最近一次调用):文件"",第1行,文件"/Library/Python/2.7/site-packagesmurmurhash导入murmurhash3_32文件"nump
浏览 5
提问于2016-08-03
得票数 60
回答已采纳
1
回答
K表示聚类:如果Elbow方法给我一条直线,那么我
的
输入特征意味着什么?
、
、
、
Elbow方法提供以下输出:
使用
:我
使用
Python和Scikitlearn
的
KMeans,因为
数据
集太大,更复杂
的
模型对Google Colab
的
计算要求太高。OBSERVATINS:我知道
列
1-5非常相关,但
数据
是有限
的
销售
数据
,几乎没有捕获有关客户
的
数据
。KMeans对输入非常敏感,这可能会影响弯头方法
中
的
WCSS,并导致直线,但这
浏览 0
提问于2020-05-15
得票数 0
1
回答
雪橇熊猫线性回归POC
的
改进
、
、
、
基本上,我在线性回归模型上部署了一个概念证明,以验证基于特定
数据
集
的
准确度系数百分比。对于以前构建
的
高层模型,我
在
dataset
中
应用了一种操作,以确保输入所需
的
所有
列
都是数字
列
和OK
列
。dataset概述公开了所有
列
都是数字和右格式化
的
。预测因子:目标:我运行一个描述,以获得更多
的
细节,并再次验证值。clf_sgd.predict(X_test) prin
浏览 1
提问于2018-02-19
得票数 1
2
回答
基于异构特征空间
的
SVM
学习
、
、
、
我正在试验一些文档分类任务,到目前为止,支持向量机
在
TF*以色列国防军特征向量上工作得很好。我想加入一些不基于词频
的
新特性(例如文档长度),看看这些新特性是否有助于分类性能。我有以下问题: 我能否简单地将新
的
特征与基于词频
的
旧特征连接起来,并在这个异构特征空间上训练支持向量机?如果不是,那么多核
学习
是否就是通过
在
每个子特征空间上训练一个内核并
使用
线性插值将它们组合起来
的
方法呢?(我们仍然没有
在
scikit
浏览 4
提问于2013-02-04
得票数 4
回答已采纳
1
回答
使用
FeatureUnion向来自不同
列
的
countvectorizer添加功能
、
、
、
、
我目前正在尝试添加一个额外
的
功能到一个countvectorizer矩阵,这个矩阵是用
scikit
-learn创建
的
。工作流程如下:我有一个dataframe,它包含一个包含文本
的
列
和一个包含附加特性
的
列
。 我首先将我
的
数据
分成训练
数据
帧
和测试
数据
帧
。然后,我
在
训练
数据
的
文本列上应用countvectorize
浏览 22
提问于2021-01-25
得票数 0
回答已采纳
1
回答
fit方法
在
sklearn.preprocessing.Normalizer()
中
的
用途是什么?
、
根据sklearn.preprocessing.Normalizer()
的
fit(self,X)方法
的
文档,它什么也不做,并且返回
的
估计量不变。我理解,如果我打算对
数据
进行规范化,我可以简单地将
数据
传递给normalize ()函数。那么,什么是
使用
适合
的
方法。此外,规范化不是一种
学习
算法,那么为什么会有一个fit()方法呢?
浏览 0
提问于2019-10-10
得票数 0
1
回答
如何为Sci-kit
学习
重新格式化分类Pandas变量
、
、
给出一只熊猫dataFrame,看上去是这样
的
:|-------|:------:|-------:|---),我尝试
使用
OneHotEncoder从
scikit
学习
了以下内容:enc = OneHotEncoder,基数为10:'f‘ 我需要把
数据
放到一个可以为
Scikit
学习<
浏览 2
提问于2015-03-26
得票数 1
回答已采纳
1
回答
基于自定义
数据
集
的
YOLOV7对象检测
、
、
、
、
我试图
使用
yolov7
预
训练模型上
的
传输
学习
来预测自定义
数据
集上
的
边界框。 我
的
数据
集包含34个训练场景,2个验证场景和5个测试场景。现场什么都没发生,只是摄像机
在
桌子/平面上
的
物体周围移动60-70度,鳞片/倾斜一点。所以,即使我有大约20k
的
训练图像(从34个场景中提取),从每个场景
中
,我得到
的
图像几乎是一样
的
,具有一种增
浏览 8
提问于2022-11-20
得票数 -1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何让excel表格中的两列数据相同的排列在一行
如何快速在多个单元格中输入相同的数据或文字
机器学习特性缩放的介绍,什么时候为什么使用
数据清洗&预处理入门完整指南
机器学习数据预处理完整入门指南!
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券