腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
ML
管线
特征
存储
的
实现
featuretools
ML
pipeline.Typical中关于
特征
存储
的
讨论很多,用例是不同
的
科学家在不同
的
模型上工作
的
特征
的
可重用性。feature feature是否支持功能
存储
概念?
浏览 14
提问于2019-06-21
得票数 1
2
回答
从Azure机器学习工作区获取所有现有
管线
python
、
azure-machine-learning-service
、
azure-machine-learning-workbench
我使用azure机器学习服务(aml)来运行一个
ml
-model。当我转到AML
的
GUI时,我可以看到所有现有的
管线
,但我看不到它们是如何调度
的
。我需要得到所有的线和相关
的
元数据。如何使用python sdk获取有关现有
管线
的
信息?
浏览 5
提问于2021-10-28
得票数 2
1
回答
使用词袋
php
我正在研究在处理
存储
为文本文件
的
电子邮件时
实现
词袋方法。我想使用可以指示电子邮件需要回复
的
关键字,使用二进制分析电子邮件(例如1|0|1|0|0等,取决于是否使用了该单词),然后获得可以用于不同
ML
算法
的
特征
向量。我正在考虑使用PHP来获取
特征
向量,但我找不到任何现有的
实现
。有没有可能在PHP中做这样
的
事情?
浏览 0
提问于2013-01-16
得票数 0
2
回答
如何查看对预测结果影响最大
的
列?
azure
、
machine-learning
、
azure-machine-learning-studio
我使用来预测使用两类增强决策树和拆分数据
的
列。 我需要
的
是,我希望看到数据集中
的
列,它对预测
的
影响和影响最大。换句话说,与数据集中
的
其他列相比,更改预测结果
的
列更多。 如果以前有人问过这个问题,很抱歉,但是我找不到这个简单问题
的
正确答案。
浏览 4
提问于2017-09-09
得票数 2
回答已采纳
1
回答
如何从UCI机器学习
存储
库将数据集(.data和.names)直接读取到Python DataFrame中
python-3.x
、
pandas
我正在寻找一种直接从UCI机器学习
存储
库中读取数据集
的
方法。但我只能获取数据集..不是它
的
描述。下面是指向我要导入
的
数据
的
https://archive.ics.uci.edu/
ml
/datasets/Car+Evaluation和https://archive.ics.uci.edu/
ml
/machine-learning-databases在那里我必须手动编写
特征</e
浏览 527
提问于2020-06-18
得票数 4
1
回答
首先要做
的
是:自动化
的
xgboost模型参数调优(Hyperopt)或特性选择(boruta)
python-3.x
、
xgboost
、
feature-selection
、
hyperparameters
、
hyperopt
我通过从数据集不同部分创建
的
许多小
的
xgboost模型来对客户进行分类。由于很难手动支持许多模型,所以我决定通过Hyperopt自动调整超参数,并通过Boruta进行特性选择。在功能选择之后,功能
的
数量从2500个减少到100个(实际上,我有50个真实特性,5个分类功能通过OneHotEncoding转到2400个)。 如果需要代码,请告诉我。非常感谢。
浏览 2
提问于2020-07-09
得票数 2
回答已采纳
1
回答
如何创建自定义可写转换器?
scala
、
apache-spark
、
apache-spark-ml
我正在通过扩展来编写一个自定义
的
spark.
ml
转换器。一切都很好,但是我不能保存这个转换器
的
实例,因为它不像所有转换器那样从DefaultParamsWritable
特征
扩展,我也不能直接混入DefaultParamsWritable
特征
,因为它是特定于org.apache.spark.
ml
的
包。解决这个问题
的
一种方法是将你
的
类放在org.apache.spark.
ml
下。这是
实现
这一目标的唯一方
浏览 0
提问于2016-04-01
得票数 5
1
回答
“
特征
提取”是机器学习
的
核心任务吗?
machine-learning
、
deep-learning
、
computer-vision
、
feature-extraction
、
pattern-recognition
我一直在和一个朋友争论“
特征
提取”
的
问题。他说,
ML
的
主要任务是提取
特征
。但我不同意。在常识中,
特征
提取不是
ML
任务。如果我们认为wx+b是表示
ML
的
最简单
的
方法,
ML
的
任务就是找到最佳
的
w和b.。
ML
试图找出给定x
的
最佳w和b值,它与训练数据相匹配,从而学习如何找到w和b。 我
的
朋友说,提取
特征</e
浏览 13
提问于2020-03-10
得票数 0
回答已采纳
1
回答
mllib.DecisionTreeModel.toDebugString()在
ml
.DecisionTreeClassificationModel中
的
等价
java
、
apache-spark
、
decision-tree
、
apache-spark-mllib
正如问题所述,在org.apache.spark.
ml
.classification.DecisionTreeClassificationModel中是否有类似于星火org.apache.spark.
ml
.classification.DecisionTreeClassificationModel
的
东西?我已经研究了后者
的
API文档,并找到了这个方法rootNode(),它返回了一个似乎是递归对象
的
org.apache.spark.
ml
.tree.Node对象,所以我应该使用这个类来自己
浏览 1
提问于2016-06-07
得票数 0
回答已采纳
1
回答
在DataFrame中以所有可能
的
组合(训练
ML
模型)删除和包含列,但一个列(目标列)除外
python
、
pandas
我想是这样
的
, index feature1(target column) feature2 feature3 feature4 0 0
浏览 6
提问于2022-09-26
得票数 0
1
回答
特征
提取、选择和分类概念
machine-learning
我知道支持向量机、随机树林和logistic回归是著名
的
机器学习(
ML
)分类算法。上面的
ML
算法是否用于提取
特征
,而不是选择
的
一部分?
ML
算法包括
特征
提取和分类两个过程吗? 训练
ML
算法
的
结果(准确性、特异性、敏感性.)在
特征
提取之后,告诉我们疾病分类
的
结果吗?
浏览 2
提问于2019-11-13
得票数 1
回答已采纳
1
回答
pySpark中随机林
的
解释
python
、
apache-spark
、
pyspark
、
apache-spark-ml
大家晚上好,prediction, bias, contributions = ti.predict(rfc, X) 经济分配数组拥有我所需
的
所有信息,然后我可以操纵它以获得所需
的
结果。
浏览 1
提问于2017-12-05
得票数 2
5
回答
PySpark & MLLib:随机森林
特征
的
重要性
apache-spark
、
pyspark
、
random-forest
、
apache-spark-mllib
我正在尝试提取我使用PySpark训练
的
随机森林对象
的
特征
重要性。但是,我在文档中没有看到这样做
的
示例,也不是RandomForestModel
的
方法。如何在PySpark中从RandomForestModel回归器或分类器中提取
特征
重要性?
浏览 2
提问于2015-03-11
得票数 16
2
回答
在机器学习中,如何在数字和分类
特征
上使用统一
的
管道?
python
、
machine-learning
、
scikit-learn
想要运行编码器上
的
分类
特征
,输入(见下文)上
的
数字
特征
,并将它们统一在一起。例如,具有分类
特征
的
数字: 'A' : ['ios', 'android', 'web', 'NaN'],android 4 13 NaN 2 0 我们希望
浏览 0
提问于2019-02-12
得票数 2
回答已采纳
3
回答
spark
ml
:如何找到
特征
重要性
scala
、
apache-spark
、
feature-selection
、
apache-spark-ml
我是
ml
的
新手,我正在使用Spark
ML
构建一个预测系统。我读到
特征
工程
的
一个主要部分是找到每个
特征
在进行所需预测时
的
重要性。在我
的
问题中,我有三个分类
特征
和两个字符串
特征
。我使用OneHotEncoding技术来转换分类
特征
,使用简单
的
HashingTF机制来转换字符串
特征
。然后,这些作为管道
的
各个阶段输入,包括
ml
Nai
浏览 1
提问于2016-08-22
得票数 1
1
回答
自动特性选择包- Python
machine-learning
、
deep-learning
、
neural-network
、
classification
、
feature-selection
我正在处理一个包含977行
的
二进制分类。班级比例是77:23。我有很多高基数
的
分类变量和一对数字变量,比如年龄和数量。( a) Featurewiz 这里( c) Xverse 这里我相信还有更多
的
软件包可以添加到这个列表中您能帮我列出python中
的
其他自动功能选择包吗?
浏览 0
提问于2022-02-21
得票数 3
回答已采纳
2
回答
特征
选择& kNN中
的
重要
特征
machine-learning
、
salesforce
、
random-forest
、
knn
我正在kNN
的
帮助下开发一个推荐引擎。然而,数据是稀疏
的
,大约有1500个样本和大约200个
特征
。我有一个值为1或0
的
序数目标。另外,对于包含我
的
样本数量如此之少
的
特征
数量,是否有任何限制?
浏览 19
提问于2017-02-03
得票数 2
1
回答
如何使用遗传算法来促进机器学习?
algorithm
、
machine-learning
、
genetic
我是一名本科生,正在对遗传算法在视频游戏中可以/确实扮演
的
角色进行非常基础
的
研究。在Youtube上,有人
的
视频展示了他们如何使用算法来教电脑玩家如何玩游戏。据我所知,遗传算法是一种搜索算法,当你知道你想要
实现
的
一般解决方案时,它是最好
的
,但不是很准确。例如。在TSP中,你知道你想要找到可能
的
最短路径,或者在一个考试安排问题中,你希望所有的学生都能够以最少
的
“中断”参加考试。在这些问题中,算法在clear中使用。然而,我在理解g.a.
浏览 1
提问于2012-08-06
得票数 0
回答已采纳
1
回答
Spark - Naive贝叶斯分类器值错误
apache-spark
、
apache-spark-mllib
在训练朴素贝叶斯分类器时,我遇到了以下问题。我得到了这个错误:return NaiveBayesModel(labels.toArray(), pi.toArray(), numpy.array(theta))当使用这一行训练模型时 dataframe = datafra
浏览 0
提问于2015-04-22
得票数 1
1
回答
火花: OneHot编码器和
存储
管道(
特征
尺寸问题)
apache-spark
、
apache-spark-ml
我们有一个由多个
特征
转换阶段组成
的
流水线(2.0.1)。当训练管道模型,并使用它来预测所有的工作良好。但是,
存储
经过训练
的
管道模型并重新加载它会引起以下问题:
存储
的
“训练有素”OneHot编码器不跟踪有多少类别。加载它现在会引起问题:当加载模型用于预测时,它会重新确定有多少类别,从而导致训练
特征
空间和预测
特征
空间具有
浏览 3
提问于2017-02-06
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
优化ML模型特征的一种线性规划方法
站在行式存储的肩膀上实现列式存储
MemNN记忆网络的特征和芯片架构的实现
频域数字射频存储器的实现
使用Python实现机器学习特征选择的4种方法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券