腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
sklearn
管道
:
在
GridSearchCV
中
应用
TimeSeriesSplit
之前
,
在
完整
的
训练
集
上
运行
TfidfVectorizer
?
python
、
scikit-learn
、
tf-idf
、
tfidfvectorizer
、
gridsearchcv
使用带有num_split=5
的
TimeSeriesSplit
给出一个
训练
数据
集
,拆分如下所示: [0] : [1][0 1 2] : [3] [0 1 2 3] : [4][0 1 2 3 4] : [5] 问题是对于前几个通道,
TfidfVectorizer
使用
的
是名义数量
的
词汇/特征,我想在拆分
之前
在
整个
训练
集
上
运行
它,以
浏览 16
提问于2019-02-22
得票数 0
回答已采纳
1
回答
sklearn
.pipeline.Pipeline:
在
不同语料库
中
拟合CountVectorizer而不是
训练
文本
python
、
scikit-learn
、
nlp
、
pipeline
、
tfidfvectorizer
我正在浏览示例
管道
,用于从scikit-learn文档中提取和评估 。在那里,它们显示了下面的
管道
from
sklearn
.feature_extraction.text
在
示例
中
,它们
在
训练
数据
集
上
拟合CountVectorizer,然后提取特征。我想要做
的
是
在
浏览 10
提问于2022-04-28
得票数 0
2
回答
TypeError:'
TimeSeriesSplit
‘对象不可迭代
python
、
machine-learning
、
scikit-learn
、
regression
、
grid-search
我
的
代码是:from
sklearn
.grid_search import
GridSearchCV
from
sklearn
import svmfrom
sklearn
(n_sp
浏览 1
提问于2018-07-04
得票数 1
回答已采纳
1
回答
GridSearchCV
与MLPRegressor与Scikit学习
scikit-learn
、
gridsearchcv
我正在尝试将自动微调
应用
到带有Scikit学习
的
MLPRegressor
上
。
在
阅读完之后,我决定使用
GridSearchCV
来选择最合适
的
超参数。在此
之前
,我已经
应用
了MinMaxScaler预处理。该数据
集
包含105个整数(每月香槟销售)。 问题在于,由于某种原因,
GridSearchCV
没有
运行
(至少我认为是正确
的
)。当我打印模型使用
的
参数时,
在</e
浏览 0
提问于2019-05-21
得票数 1
2
回答
ValueError
在
预测测试数据具有不同形状
的
单词向量
的
位置
python
、
machine-learning
、
scikit-learn
、
text-classification
下面是我
的
代码,我正在尝试文本分类模型;ifidf_vectorizer =
TfidfVectorizer
import LinearSVCclf.fit(X_train_tfidf,y_train) 到目前为止,只有
训练
集
被向量化成
完整
的
词汇表。为了
在
测试
集
浏览 1
提问于2020-07-09
得票数 1
回答已采纳
1
回答
使用scikit
中
的
管道
扩展数据-学习: StandardScaler与RobustScaler
python
、
machine-learning
、
scikit-learn
、
logistic-regression
我想使用
GridSearchCV
来确定使用L1正则化
的
logistic回归中
的
最佳正则化参数"C“。我还想扩展/标准化我
的
输入功能。
在
执行交叉验证
之前
,使用单个变换对整个
训练
数据
集
进行缩放会导致数据泄漏:
在
交叉验证
中
,
训练
数据
集
被分为k个折叠,每个折叠被视为验证数据
集
一次,而其余
的
则是
训练
折叠。然而,如果标准
浏览 1
提问于2018-03-14
得票数 1
2
回答
如何在不分割数据
的
情况下
运行
sklearn
.model_selection.
GridSearchCV
?
python
、
scikit-learn
我想评估一个模型
管道
的
性能。我并不是
在
实地
训练
我
的
模型--我正在评估
管道
的
真实标签,因此没有必要做一个交叉验证方案。但是,我仍然希望使用
sklearn
中提供
的
网格搜索功能。是否可以
在
不分割数据
的
情况下使用
sklearn
.model_selection.
GridSearchCV
?换句话说,我想
运行
Grid搜索,并在传递给
管道
<em
浏览 3
提问于2020-02-19
得票数 1
1
回答
使用网格搜索调整模型
python-3.x
、
machine-learning
、
scikit-learn
我遇到了一个使用Grid search调优参数
的
示例,以及
在
管道
中使用
TfidfVectorizer
()调优文本数据
的
示例。据我所知,当我们调用grid_search.fit(X_train,y_train)时,它会转换数据,然后根据字典
中
的
描述来拟合模型。然而,
在
评估过程
中
,我对测试数据
集
感到有点困惑,因为当我们调用grid_search.predict(X_test)时,我不知道/(如何)
Tf
浏览 0
提问于2019-10-14
得票数 0
1
回答
如何在Scikit-learn
中
重新
训练
具有不同数据
的
管道
?
python
、
machine-learning
、
scikit-learn
、
pipeline
我使用
管道
进行机器学习模型
训练
,使用Python进行K-折叠交叉验证,并对我所有历史数据
的
子集(省略测试
集
)进行
sklearn
,如下所示:CV.fit(train_X然而,
在
最后,我想在我
浏览 18
提问于2020-08-02
得票数 0
1
回答
特征标准化-多层感知器
machine-learning
、
python
、
scikit-learn
、
feature-scaling
对于多层感知器学习过程
之前
的
特征标准化,我有严重
的
疑问。from
sklearn
.preprocessing import StandardScaler # Don't cheat,然后
在
测试
集
上进行标准化。现在,因为我需要将我
的
多
浏览 0
提问于2017-11-15
得票数 0
回答已采纳
3
回答
通过
管道
使用
sklearn
的
GridSearchCV
,只需预处理一次
python
、
numpy
、
machine-learning
、
scikit-learn
、
grid-search
我
的
问题
的
一个简单版本如下所示:from
sklearn
.model_selection import
GridSearchCV
y=np.random.randint(2, size=(10,)))
在
我
的
例子
中
,预处理(玩具示例
中<
浏览 2
提问于2017-04-12
得票数 33
回答已采纳
1
回答
cross_val_score和
gridsearchCV
是如何工作
的
?
python
、
cross-validation
我对python很陌生,我一直
在
试图弄清楚
gridsearchCV
和cross_val_score是如何工作
的
。下面是:import numpy as np from
sklearn
.preprocessingimport
GridSearc
浏览 1
提问于2018-05-31
得票数 2
回答已采纳
1
回答
基于交叉验证
的
sklearn
自定义矢量转换器
machine-learning
、
python
、
classification
、
cross-validation
、
pipelines
这个类
的
目的是为
GridSearchCV
或RandomizedSearchCV提供特定于向量器
的
超参数(例如:ngram_range、向量器类型:CountVectorizer或
TfidfVectorizer
),以避免每次我们认为不同类型或设置
的
向量器能够更好地工作时都必须手动重写
管道
。()] randsearch =
GridSearchCV
(pipe, param_dict, cv=2, scoring='f1').fit(X_train,
浏览 0
提问于2022-01-02
得票数 0
回答已采纳
1
回答
使用Scikit获取预测
的
问题--
在
Google平台上学习:'numpy.ndarray‘对象没有’更低‘属性’“
python
、
scikit-learn
、
google-cloud-platform
、
google-prediction
我成功地用TfIdf vecotrizer (用于情感分析)
在
Scikit
上
训练
了一个Logistic回归模型--
在
本地使用木星笔记本学习,以及
在
Google平台上使用他们
的
培训工作特性。创建
管道
从
sklearn
.feature_extraction.text
TfidfVectorizer
tvec=
TfidfVectorizer
() lclf = LogisticRegression(fit_intercept
浏览 0
提问于2019-07-31
得票数 0
1
回答
我是否
在
k折cross_validation中使用相同
的
Tfidf词汇表?
python
、
scikit-learn
、
cross-validation
、
tf-idf
我正在做基于TF-IDF向量空间模型
的
文本分类,我只有不超过3000 samples.For
的
公平评估,我正在使用5折交叉验证对分类器进行评估,但令我困惑
的
是,是否有必要在每次折叠交叉验证
中
重建TF-IDF也就是说,
在
每个折叠交叉验证
中
,我是否需要重新构建词汇表并重新计算词汇表
中
的
IDF值? 目前,我正在基于scikit-learn工具包进行TF-IDF变换,并使用SVM
训练
我
的
分类器。我
的
方法如下
浏览 1
提问于2017-09-02
得票数 12
2
回答
如何将滑雪板
管道
转换成火花放电
管道
?
python
、
pyspark
、
scikit-learn
、
databricks
、
apache-spark-ml
我们有一个机器学习分类器模型,我们已经
训练
了一个熊猫数据和一个标准
的
学习
管道
(StandardScaler,RandomForestClassifier,
GridSearchCV
等)。我们正在研究Databricks,并希望使用并行计算火花提供
的
方法将这个
管道
扩展到一个大型数据
集
。 将我们
的
sklearn
管道
转换为并行计算
的
最快方法是什么?(我们可以很容易地
在
熊猫之间切换,并根据需
浏览 3
提问于2020-09-01
得票数 6
回答已采纳
3
回答
是否可以安装
sklearn
管道
的
不同部分?
python
、
machine-learning
、
scikit-learn
、
pipeline
、
model-fitting
考虑使用下面的
sklearn
Pipeline pipeline = make_pipeline( LinearRegression() ) 我对
TfidfVectorizer
进行了预
训练
,所以当我调用pipeline.fit(X, y)时,我只希望安装LinearRegression,而不想重新安装
TfidfVectorizer
。我可以提前
应用
转换,并在转换后
的
数据
上
适应LinearRegress
浏览 20
提问于2021-04-29
得票数 4
1
回答
时间序列预测.滑动窗口法
scikit-learn
、
time-series
、
supervised-learning
、
forecasting
我一直
在
试图理解这种滑动窗口技术,但没有效果,而且真的不确定我将如何实现它。我知道我需要使用历史已知
的
值
浏览 0
提问于2018-03-16
得票数 2
1
回答
有什么更好
的
方法来
训练
你自己
的
情感分析模型,或者使用像vader和textblob这样经过预先
训练
的
模型呢?
python
、
logistic-regression
、
sentiment-analysis
、
pre-trained-model
我有python脚本,它
训练
了一个用于情感分析
的
数据
集
,并使用logisticRegression模型和tfidf、交叉验证、bigram和
GridSearchCV
创建了一个模型。为了比较这两种模型,我尝试使用预先
训练
过
的
模型,如VaderSentiment。根据实际数据得出
的
结果是:那么,我
训练
的
模型
中
的
浏览 2
提问于2020-07-28
得票数 0
1
回答
最佳模型
的
GridSearch :保存和加载参数
python
、
parameters
、
scikit-learn
、
pickle
、
grid-search
我喜欢
运行
以下工作流: from
sklearn
.feature_extraction.text i
浏览 0
提问于2019-01-15
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
时间序列的蒙特卡罗交叉验证
只需一根“管道”,你就可以将机器学习中的复杂步骤串联起来
想提高预测精度?7步教你微调机器学习模型
用机器学习分析流行音乐(三):构建模型
机器学习第一步,这是一篇手把手的随机森林入门实战
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券