腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
sklearn
子集
拟合
管道
-
用于
转换
的
重用
我已经构建了一个包含几个步骤
的
管道
,这需要一些时间来适应。为了进行调试,我希望能够检查该
管道
的
子集
(例如{pipe step 1-3}.transform(X))。我知道我可以使用
管道
(pipe.named_steps:3)来提取一个
子集
,并从它构建一个新
的
管道
。不幸
的
是,在调用transform之前,我必须重新调整
管道
。 有没有办法避免改装?
浏览 12
提问于2020-06-23
得票数 0
回答已采纳
1
回答
特征标准化-多层感知器
、
、
、
对于多层感知器学习过程之前
的
特征标准化,我有严重
的
疑问。from
sklearn
.preprocessing import StandardScaler #
浏览 0
提问于2017-11-15
得票数 0
回答已采纳
1
回答
TypeError: fit()带3个参数(2个给定)与
sklearn
和
sklearn
_pandas
、
、
、
、
我正在尝试使用
sklearn
_pandas模块来扩展我在熊猫中所做
的
工作,并深入机器学习,但是我正在为一个错误而挣扎,我并不真正理解如何修复。from
sklearn
_pandas import DataFrameMapper, cross_val_scoremodule>() ----> 1
浏览 2
提问于2014-07-05
得票数 1
回答已采纳
1
回答
数据帧和
子集
数据帧之间
的
Cosine_similarity
、
、
、
基本上,我有一个以电影为行
的
数据帧,一个列“标题”和一个列“汤”。最后一列以字符串
的
形式包含电影和合作者
的
概述。 我有一个包含电影
子集
的
第二个数据帧。(因此“汤”也是完整DF
的
一个
子集
) 现在使用以下代码: from
sklearn
.feature_extraction.text import CountVectorizer from
sklearn
.metrics.pairwisecount.fit_transform(df_sub
浏览 11
提问于2020-08-27
得票数 1
回答已采纳
1
回答
sklearn
.pipeline.Pipeline:在不同语料库中
拟合
CountVectorizer而不是训练文本
、
、
、
、
我正在浏览示例
管道
,
用于
从scikit-learn文档中提取和评估 。在那里,它们显示了下面的
管道
from
sklearn
.feature_extraction.text在示例中,它们在训练数据集上
拟合
CountVectorizer,然后提取特征。我想要做
的
是在一个更大
的
语料库上
拟合
CountVectorizer,
浏览 10
提问于2022-04-28
得票数 0
2
回答
管道
中y变量
的
预
拟合
标准标量逆变换
、
我想要创建
管道
,它将在模型预测之后对y变量进行逆变换。我有三个泡菜文件:Y变量标量变换预
拟合
对象:-Y sclr我将它导入python,现在我希望使用这个文件创建
管道
,其中输入数据将由Xsclr参数
转换
成标量from
sklearn
.pipeline import Pipeline pipe = Pipeline(steps=[(StandardScaler(), Xsclr(SVR(), model
浏览 0
提问于2020-07-24
得票数 2
1
回答
如何在
Sklearn
Pipeline中使用SMOTE来解决NLP分类问题?
、
、
、
、
我
的
数据如下所示: product_description class"Beauty product这是我
的
流水线当前
的
样子: X = df['product_description']y
浏览 163
提问于2021-09-08
得票数 4
1
回答
有没有理由去做.fit()和.transform()而不仅仅是.fit_transform()?
、
、
我刚开始学习ML,想知道当.fit_transform()存在
的
时候,为什么要分别做.fit()和.transform()。另外,我通常对what /.fit()到底做什么感到困惑。
浏览 0
提问于2020-06-18
得票数 0
1
回答
在使用StandardScaler
管道
和GridSearch时,如何在目标变量上应用GridSearch?
、
、
、
我想使用
sklearn
管道
在Ames数据集上训练ML模型,如下所示:from
sklearn
.model_selection: 下一步是特征选择和
拟合
模型。但是,我想将StandardScaler应
用于
目标变量(y)。我想知道如何将此步骤包含在
sklearn
管道
中,以确保
浏览 8
提问于2022-09-01
得票数 0
回答已采纳
2
回答
XGboost:无法在
管道
中传递eval_set
的
验证数据
、
、
、
我有数据
的
预处理器,上面定义了代码,一些网格参数pipe = Pipeline(steps=[ ('XGBmodel', XGBmodel)我想通过这些
拟合
参数 fit_params = {"XGBmodel__eval_set": [(X_valid似乎它应该是有效
的
。此外,我还试图找到一种方法,分别为验证数据应用预
浏览 1
提问于2019-05-29
得票数 5
1
回答
在
sklearn
管道
中
转换
估计器
的
结果
、
、
、
我有一个
sklearn
管道
,它由一个自定义
转换
器组成,后面是XGBClassifier。我想在
转换
器中添加
的
最后一步是另一个自定义
转换
器,它
转换
XGBClassifier
的
结果。最后一个自定义
转换
器将预测
的
概率排序为等级(5-百分位数)。', custom_trsf1), ('custo
浏览 1
提问于2020-11-26
得票数 1
1
回答
我应该在SMOTE之前还是之后执行GridSearch (
用于
调整超参数)?
、
、
、
、
我使用不平衡数据通过scikit-learn执行分类并提高模型
的
准确性,我使用SMOTE技术创建了更多
的
合成数据。我想知道用GridSearch实现超参数优化
的
最佳时机。
浏览 12
提问于2019-10-30
得票数 0
1
回答
sklearn
的
流水线中出现内存错误
、
、
、
我在代码中创建了一个
管道
,如下所示from
sklearn
.linear_modelimport SGDClassifier ('tfidfTfidfVectorizer(max_df=0.5, min_df=10)), ('
浏览 0
提问于2017-03-23
得票数 0
1
回答
模型整定与模型
拟合
的
特征顺序
、
、
假设同一列(即特征)
用于
超参数调整和模型
拟合
,而集成模型
用于
建模(例如,随机森林或XGboost),那么在超参数调整过程中使用
的
列
的
顺序是否应与基于最佳超参数
拟合
模型时使用
的
列
的
顺序相同?我在我
的
简历
管道
中使用
sklearn
的
make_column_transformer函数进行超参数调整。不幸
的
是,当将余数参数设置为“passthrough”时,此函数修改了提供
浏览 0
提问于2020-02-10
得票数 1
回答已采纳
1
回答
如何在
Sklearn
管道
中进行Onehotencoding
、
、
、
我意识到使用pandas .get_dummies()函数可以很容易地做到这一点,但我需要使用
管道
,以便稍后可以生成PMML文件。 [(d, LabelEncoder()) for d in dummies] +) ("regressor&qu
浏览 15
提问于2017-02-13
得票数 13
回答已采纳
2
回答
如果我们使用
管道
,我如何获得树解释器
的
树贡献?
、
、
、
几乎和
的
帖子完全一样。 from
sklearn
.pipeline import Pipeline from
sklearn
.linear_mod
浏览 2
提问于2020-11-27
得票数 3
回答已采纳
1
回答
为什么ColumnTransformer不在它
的
转换
器上调用fit?
、
我已经定义了数据,用一个分类特征“性别”进行
拟合
: data = pd.DataFrame({ 'sex': ['female', 'male'female'],})y = data['won_lottery'] 和<em
浏览 13
提问于2019-06-12
得票数 6
回答已采纳
1
回答
有意义地解释BaseN编码
的
特征重要性
、
、
、
我有一个用户出生地
的
数据,特别是一个城市。因为我
的
数据集中有几千个城市,所以我寻找OneHot编码
的
替代方案,因为我不想为一列向我
的
数据集中添加数千列。我发现BaseN编码是OneHot
的
一个很好
的
替代方案,所以我选择了它。我用基数4对我
的
数据进行了编码,所以现在我使用
的
是City_0、City_1等,而不是字符串column City。但是,在使用随机森林分类器对数据集进行建模后,我发现某些City_#变量是最重要
的
特性之一。但是我
浏览 46
提问于2021-10-03
得票数 0
2
回答
如何用手电筒在起泡器中建立
管道
、
、
、
我正在处理一个在sagemaker中使用文本数据进行分类
的
问题。在这里,我首先将其
拟合
并
转换
为结构化格式(例如,通过在
sklearn
中使用TFIDF ),然后我将结果保存在S3桶中,并将其
用于
训练我
的
pytorch模型,并在我
的
入口点为其编写了代码。滑雪板TFIDF模型 因此,每当我需要预测一个新
的
文本数据时,我需要使用我在培训期间创建
的
TFIDF模型分别处理(
转换
)文本数据。如何
浏览 0
提问于2019-09-03
得票数 0
6
回答
获取scikit学习
管道
中
的
中间数据状态
、
给出了以下示例:from
sklearn
.decomposition importNMFimport pandas as pd ("tf_idf", TfidfVectorizer学习
管道
中
的
中间数据状态。或者用另一种方式说,这和应用是一样<e
浏览 0
提问于2018-02-12
得票数 26
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券