腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8586)
视频
沙龙
1
回答
如何
使用
Scikit-learn
创建
同时
具有
数字
和
1-hot
分类
特征
的
训练
数据
集
?
python
、
machine-learning
、
scikit-learn
我有一个包含连续值
和
分类
值
的
训练
数据
集
。我已经
使用
scikit学习了一个带有
分类
特征
的
训练
集
(x_train_1hot),我还有一个带有
数字
特征
的
训练
集
(x_train_num)。OneHotEncoder(handle_unknown='ignore') X = nump
浏览 9
提问于2021-04-16
得票数 0
回答已采纳
1
回答
如何
在
scikit-learn
中加载包含txt文件
的
数据
集
scikit-learn
、
dataset
、
svm
我将
使用
scikit-learn
库来实现我
的
SVM
分类
。 我
的
特征
的
值是0/1,我已经将这些值保存在
特征
的
txt文件和我
的
标签
的
单独
的
txt文件中。现在我
的
问题是,
如何
使用
scikit-learn
加载用于
训练
和
测试阶段
的
外部
数据
<
浏览 21
提问于2017-01-30
得票数 0
回答已采纳
1
回答
在
scikit-learn
- csv文件中生成图像
特征
数据
集
image
、
dataset
、
machine-learning
、
scikit-learn
、
feature-extraction
我从一张图像中提取了两个边缘
特征
(Hog
特征
和
sobel算子)。不幸
的
是
浏览 1
提问于2012-12-11
得票数 0
回答已采纳
1
回答
主成分分析中
特征
值
和
特征
向量
的
发现及在知识学习中
的
应用
python
、
machine-learning
、
scikit-learn
、
pca
我一直在
使用
在
scikit-learn
中实现
的
PCA。但是,我希望找到在拟合
训练
数据
集
后产生
的
特征
值
和
特征
向量。文档中没有提到这两种情况。 其次,这些
特征
值
和
特征
向量本身是否可以用作
分类
目的
的
特征
?
浏览 44
提问于2016-06-11
得票数 6
2
回答
如何
从CSV文件中
训练
和
测试一个简单
的
二进制
分类
器?
python
、
csv
、
classification
、
svm
、
naivebayes
我用tweets bigram做了一个下面的CSV文件,我想
训练
一个模型来预测标签。我在网上找到
的
大多数示例都包含带有附加参数
的
数字
特征
,这使得它很难理解。在这里,我要求一个非常简单
的
例子来理解应该
如何
使用
python (
使用
诸如
scikit-learn
之类
的
库)来
训练
和
测试
使用
这个最简单
的
CSV
数据
集
浏览 26
提问于2020-10-27
得票数 0
1
回答
用于
特征
选择
的
自动编码器
machine-learning
、
python
、
deep-learning
、
keras
、
tensorflow
我正在
使用
一个
具有
41个
特征
、
数字
和
名词
的
数据
集
,其中42个是类(正常与否),首先我将所有的名词特性更改为
数字
,因为自动编码器要求输入向量应该是
数字
的
。因此,
特征
的
数量从42个增加到122个。我删除了类colomn,因为AE
使用
未标记
的
数据
,我
使用
它将维度从121降到10 ( 121>
浏览 0
提问于2018-06-18
得票数 4
2
回答
如何
利用Python在卫星图像上
训练
SVM
分类
器
python
、
machine-learning
、
scikit-learn
、
svm
、
k-means
我
使用
scikit-learn
库对卫星图像执行监督
分类
(支持向量机
分类
器)。我
的
主要问题是
如何
训练
我
的
SVM
分类
器。我在youtube上看过很多视频,也读过一些关于
如何
在
scikit-learn
中
训练
支持向量机模型
的
教程。我看过
的
所有教程,都
使用
了著名
的
Iris
数据
集
。通过阅
浏览 0
提问于2017-04-10
得票数 5
回答已采纳
1
回答
合适
的
集合(均值、中值或其他什么)来生成
特征
?
classification
、
feature-engineering
、
feature-construction
试图
使用
大量
的
特征
来解决
分类
问题,有些是信号中
的
单个
数字
,而另一些则是用于
创建
特征
(中值、均值等)
的
值
的
集合。我
使用
相同信号(n值)
的
多个聚合(m值)来
创建
一组相对较大
的
~100
特征
集(m*n值)。 与特性相同
的
多个
数据
聚合可以吗?如果没有,我应该选哪一个,怎么选?这些
数据
<
浏览 0
提问于2017-05-15
得票数 -1
2
回答
scikit了解SelectPercentile TFIDF
数据
特征
缩减
python
、
text
、
machine-learning
、
scikit-learn
我
使用
scikit-learn
中
的
各种机制来
创建
由文本
特征
组成
的
训练
数据
集
和
测试
集
的
tf-idf表示。这两个
数据
集
都经过预处理,以
使用
相同
的
词汇表,因此
特征
和
特征
的
数量是相同
的
。我可以在
训练
数据<
浏览 0
提问于2015-04-01
得票数 2
2
回答
如何
从纯文本中提取
特征
?
algorithm
、
machine-learning
、
nlp
我正在编写一个文本解析器,应该从产品描述中提取
特征
。我这样做
的
方式是用结构化
数据
训练
系统,并提出一个倒排索引,它可以将术语映射到
特征
。这在很大程度上效果很好。当文本包含像50ml或2kg这样
的
度量时,倒排索引将为例如
的
2kg -> Size
和
50ml -> Size。 这里
的
问题是,当我得到一个我以前没有见过
的
值,比如13ml,它不会被处理。我正在考虑通过预处理从文本中获得
的
标记来解决这
浏览 0
提问于2016-05-16
得票数 0
2
回答
我们需要关心
训练
中
的
目标变量分布
和
回归问题中
的
验证
集
吗?
machine-learning
、
scikit-learn
在
分类
问题中,我们关心
的
是标签在
训练
和
验证集中
的
分布。在sklearn中,train_test_split中有stratify选项,以确保
训练
和
验证集中
的
标签分布相似。在一个回归问题中,假设我们想要根据一系列
特征
来预测房价。我们需要关心房价在
训练
集
和
验证
集
上
的
分布吗? 如果是,我们
如何
在sklearn中实现这一点
浏览 2
提问于2019-03-03
得票数 1
3
回答
如何
使用
lightGBM处理多个
数据
文件
lightgbm
我正在尝试
使用
lightGBM作为
分类
器。我
的
数据
保存在多个csv文件中,但我发现无法直接
使用
多个文件作为输入。 我曾考虑将所有
数据
合并成一个大
的
数据
(numpy数组),但我
的
计算机没有足够
的
内存。当可用内存不足时,
如何
使用
lightGBM处理多个
数据
文件?
浏览 1
提问于2018-04-24
得票数 0
1
回答
需要帮助将
scikit-learn
应用于此不平衡
的
文本
分类
任务
scikit-learn
、
feature-selection
、
text-classification
、
precision-recall
我有一个多类文本
分类
/
分类
问题。我有一组
具有
K不同互斥类
的
基本事实
数据
。这是一个在两个方面不平衡
的
问题。首先,有些班级比其他班级频繁得多。我
的
目标是开发一个单独
的
分类
器或它们
的
集合,以便能够以高精度(至少80%)对感兴趣
的
k << K类进行
分类
,
同时
保持合理
的
召回率(什么是“合理
的
”有点模糊)。我
使
浏览 3
提问于2015-10-16
得票数 0
1
回答
支持向量机
的
工作原理
classification
、
svm
、
categorical-data
我有一个由
数字
特征
和
分类
特征
组成
的
数据
集
。我要用支持向量机
训练
训练
集
。SVM是一种二次型优化算法。我想知道支持向量机是
如何
处理
分类
数据
的
。有人能分享任何参考资料,研究论文
的
链接,或描述过程
的
网页链接吗? 我也期待着了解支持向量机处理
分类
数据
背后
的</
浏览 0
提问于2022-09-30
得票数 1
回答已采纳
3
回答
weka中新实例
的
分类
classification
、
weka
、
feature-selection
在我们
的
训练
集中,我们执行了
特征
选择(例如,CfsSubsetEval GreedyStepwise),然后
使用
分类
器(例如,J48)。我们已经保存了Weka
创建
的
模型。现在,我们希望对新
的
未标记实例进行
分类
(在进行
特征
选择之前,它仍然
具有
训练
集
的
原始属性数)。我们假设我们应该在这组新
的
未标记实例中执行
特征
选择
浏览 0
提问于2013-05-18
得票数 0
1
回答
如何
绘制只有一个
特征
的
svm超平面
python
、
machine-learning
、
scikit-learn
、
svm
、
data-analysis
我有一个只有一个
特征
的
数据
集
,我正在
使用
scikit-learn
训练
支持向量
分类
器。我想可视化结果,但我对
如何
绘制散点有点困惑。我通过执行以下操作来获得我
的
超平面: slope = clf.coef_[0][0] intercept = clf.intercept_[0] 结果是y= -.01x + 2.5 我猜这是我
的
超飞机。我似乎不知道
如何
在只有一个
特征
<em
浏览 34
提问于2019-09-28
得票数 1
回答已采纳
1
回答
具有
数值
和
虚拟特性
的
数据
集
标准化
machine-learning
、
preprocessing
、
feature-scaling
我有一个
具有
数值
和
分类
特性(变量)
的
数据
集
,我将所有的
分类
变量转换为虚拟
数据
,然后将
训练
和
测试
数据
分割。在这种情况下,在0到1
的
范围内
使用
MinMax标量更好吗?
浏览 0
提问于2018-04-16
得票数 1
1
回答
利用图像
和
外部
数据
集
进行二进制
分类
machine-learning
、
deep-learning
我目前有一个项目,在这个项目中,我必须
创建
一个二进制
分类
器来检测缺陷产品。我有已经被标记
的
图像
数据
(每个部分都被标记为通过或失败),以及一个外部
数据
集
,该
数据
集
对每一幅图像都有特定
的
测量值(它包含摄像机无法准确捕获
的
参数,例如温度、特定片段
的
长度等)。通过应用基本
的
分类
算法,例如logistic回归
和
支持向量机(在
scikit-learn
浏览 0
提问于2020-07-24
得票数 1
回答已采纳
1
回答
基于多种
数据
类型
特征
的
决策树
python
、
scikit-learn
、
decision-tree
我正在尝试用
scikit-learn
的
DecisionTreeClassifier构建一个决策树。我
的
数据
具有
由整数
和
浮点数组成
的
数字
特性。如果将整数特性
浏览 2
提问于2016-01-09
得票数 3
回答已采纳
2
回答
用于结果预测
的
机器学习算法/库
machine-learning
、
deep-learning
我对这个
数据
科学世界非常陌生,所以如果我
的
问题不是很清楚的话,我很乐意澄清。我想要
的
很简单:用一组值
训练
一个程序(5个有序
的
整数输入,1个布尔输出)。然后,我会给它5个输入,结果不知道,它必须告诉我
的
结果。
浏览 0
提问于2017-06-07
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习100天:第1天
美国“返利网”开源sk-dist框架将sklearn训练速度提升数倍
将sklearn训练速度提升100多倍,美国“返利网”开源sk-dist框架
Scikit-learn应用指南:监督学习第1部分-分类
将sklearn训练速度提升100多倍,美国「返利网」开源sk-dist框架
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券