腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
sklearn
中
尝试
fit_transform
管道
时
生成
TypeError
、
我正在
尝试
为爱荷华州艾姆斯的住房设置一个Kaggle竞赛的预测模型,但我
在
执行我的
管道
时
遇到了问题,因为我不断收到错误。下面是我
尝试
运行的代码from
sklearn
.pipeline import Pipelinefrom
sklearn
.pre
浏览 17
提问于2019-11-13
得票数 1
1
回答
管道
不适用于标签编码器
、
、
我如下所示from
sklearn
import preprocessingfrom
sklearn
.pipeline importpreprocessing.LabelEncoder()) encoding_pipeline.fit_transform(df)
TypeError
\pipeline.py in
fit_transform
(
浏览 7
提问于2016-10-17
得票数 2
回答已采纳
1
回答
学习:
在
管道
中
应用相同的比例来训练和预测。
、
我正在编写一个函数,在这个函数
中
,最好的模型是通过k折叠交叉验证选择的。
在
函数内部,我有一条
管道
编辑:我
在
预处理文档中发现每个预处理工具都有一个API 计算训练集上
浏览 2
提问于2017-11-20
得票数 3
回答已采纳
1
回答
具有多重估计量的
Sklearn
管道
、
、
、
、
在
链接估值器并试图查看
时
,面对错误。这是我第一次
尝试
这个
管道
函数。from
sklearn
.pipeline import Pipelinefrom
sklearn
.linear_modelLogisticRegression()),('linear_model',LinearRegression())] pipeline_estimator=
浏览 3
提问于2020-09-08
得票数 0
回答已采纳
2
回答
滑雪
管道
中文本数据的转换
、
、
给定一个文本数据数组,我想使用
sklearn
管道
来产生输出,如我最初的
尝试
('encoder
浏览 2
提问于2015-08-05
得票数 1
回答已采纳
1
回答
学习
管道
TypeError
: zip参数#2必须支持迭代
、
、
、
我正在
尝试
为
sklearn
管道
创建一个自定义转换器,它将提取特定文本的平均单词长度,然后在其上应用标准标量来标准化数据集。我要把一系列的文本传递给
管道
。
fit_transform
时
,我得到的是错误, main()
浏览 0
提问于2019-04-22
得票数 8
回答已采纳
1
回答
为什么我
在
python上得到一个list object is not callable错误?
、
、
、
我读取文件并将其存储
在
documents变量
中
,如下所示: documents=author_labels(raw_data_dir)documents=pd.read_csv(documents_filename,index_col="document_id") documents.head() 随后,我
尝试
使用次线性增长
生成
tf-idf向量,并将其存储
在
一个名为vector
浏览 37
提问于2019-09-28
得票数 1
1
回答
TfidfVectorizer.fit_transform提供类型错误
、
、
但在开始之前,我
尝试
为几个小文档编写代码,每个文档不超过5-6个单词。min_df=1)它在我的笔记本电脑上运行得很好,但当我
在
服务器上运行它
时
,它会
生成
以下错误:max_features) File "/usr/lib64/python2.6/site-packages/
sklea
浏览 7
提问于2016-06-08
得票数 1
1
回答
科学学习:学习曲线没有信息泄漏?
我想为LinearSVC估计器
生成
一个学习曲线,它使用countVectorizer来提取特征。countVectorizer还应用了一些特性选择步骤。我可以做以下几点:但我认为这会导致信息泄漏:基于所有数据的信息将被用于为学习曲线中使用的较小集合选择特征。有没有一种方法可以
在
不泄露信息的情况下使用内置
sklearn
浏览 5
提问于2019-12-18
得票数 0
回答已采纳
1
回答
sklearn
管道
中出现"ValueError:所有输入数组必须具有相同的维数“错误
、
、
我正在使用
sklearn
pipeline构建一个机器学习
管道
。
在
预处理步骤
中
,我
尝试
对两个不同的sting变量进行两种不同的处理: 1) BusinessType上的热编码2) AreaCode上的平均编码,如下所示: return df[['AreaCode1','isFail']] 现在,当
浏览 0
提问于2018-10-30
得票数 4
1
回答
Tfidf转换器(
sklearn
)会导致:“类型不支持转换:(dtype('O'),)”
、
、
我有一个字符串列表,我将其
fit_transform
到CountVectorizer
中
。当我
尝试
TfidfTransform它
时
,我得到了错误:count_vect =CountVectorizer() from
sklearn
.feature_extraction.te
浏览 15
提问于2018-01-27
得票数 2
1
回答
Scikit-learn (
sklearn
) PCA
在
稀疏矩阵上抛出类型错误
、
、
、
从
sklearn
RandomizedPCA的
中
,稀疏矩阵被接受为输入。然而,当我使用稀疏矩阵调用它
时
,我得到了一个
TypeError
:'0.16.1'> pca.fit(my_sparce_mat)对如何让它工作有什么
浏览 3
提问于2015-05-15
得票数 2
1
回答
在
sklearn
中
创建自定义转换器
时
出错-采用2个位置参数,但提供了3个
、
、
我正在
尝试
使用通用数据集的自定义transfomers创建一个Pipeline。这是我的第一个转换器。给定一个列名,它将该datetime列分解为更多列。这是
管道
。imputer',DatePartTransformer('date')),]) ----> 6 df = pipeline.fit_transform(df_raw)
浏览 19
提问于2020-04-09
得票数 0
回答已采纳
1
回答
如何为随机森林分类器建立可重用的科学学习
管道
?
、
我
在
试着理解科学学习
管道
是如何工作的。我有一些虚拟数据,我试图拟合一个随机森林模型的虹膜数据。'> 但是,当我执行pipeline.fit_transform(X_train, y_train)
时
,我会看到一个错误:AttributeError: 'RandomForestClassifier'
在
正常情况下,
在
没有任何pipeline代码的情况下,我通常所做的是采取一个ML模型,并在我的training数据集上应用
fit_transform
(),<em
浏览 1
提问于2020-10-02
得票数 4
回答已采纳
1
回答
sklearn
类方法的参数
、
因此,
在
浏览了大量
sklearn
的文档后,我注意到许多
sklearn
预处理类(如标准scaler )都有一个.transform方法,该方法获取X值并对其进行缩放。然而,为了确保这可以
在
管道
中
执行,该方法还确保将y值也作为输入(尽管如果需要可以忽略) 因此,问题1:这些方法的文档如下所示:
fit_transform
(self,X,y)。问题2:如果我对第一个问题的想法是正确的,那么SelectKBest的
fit_transform
文档如下所示: <e
浏览 19
提问于2020-07-08
得票数 2
回答已采纳
1
回答
为什么
fit_transform
在这个
sklearn
Pipeline示例
中
不起作用?
、
我是一个新的
sklearn
Pipeline,并遵循了一个示例代码。我在其他例子中看到我们可以做pipeline.fit_transform(train_X),所以我
在
pipeline.fit_transform(X)的
管道
上
尝试
了同样的事情,但它给了我一个错误
TypeError
: fit()恰好接受3个参数(给定2个)“ 如果我删除svm部分并将
管道
定义为pipeline = Pipeline有人知道为
浏览 0
提问于2016-06-28
得票数 0
1
回答
LabelEncoding多分类列
、
、
我有一个混合了int、float、categorical和bool数据类型的DataFrame,我正在
尝试
使用LabelEncoder.fit_transform将categorical和bool数据类型转换为当在单个列上执行时,它工作得很好,但是当我
尝试
在
DF
中
执行for循环
时
,我得到了以下错误:for i in first_buyer.columns\preprocessing\label.py in
fit_tr
浏览 2
提问于2019-11-07
得票数 0
1
回答
学习PipeLine拟合和转换错误
、
、
有关于
管道
的代码,它抛出一个名为"AttributeError:‘经度’的错误,它不是'Series‘的一个有效函数,是我试图运行的代码-。cat_pipeline) ] ) housing_prepared 这里是我正在使用的数据的链接:When我
在
没有
浏览 1
提问于2020-06-15
得票数 2
回答已采纳
2
回答
ValueError
在
预测测试数据具有不同形状的单词向量的位置
、
、
、
下面是我的代码,我正在
尝试
文本分类模型;ifidf_vectorizer = TfidfVectorizer为了
在
测试集上执行分析,我需要将它提交给相同的过程。所以我做了X_test_tfidf.shape最后,
在
试图预测其显示误差
时
predictions
浏览 1
提问于2020-07-09
得票数 1
回答已采纳
1
回答
_transform()接受两个位置参数,但给出了3个
、
、
我试图构建一个具有变量转换的
管道
,如下所示import pandas as pdfrom
sklearn
import linear_modeldef transform(self, X1, X2): return age return self.transform(X1,
浏览 1
提问于2016-11-01
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
特征工程之字典数据特征抽取
特征工程:特征缩放、选择
python主题LDA建模和t-SNE可视化
机器学习三人行-end-to-end机器学习
了解一下sklearn机器学习库
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券