腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scikit-
在
小批量
中
学习
tfidf
向
量器
?
、
我一直试图
在
一个大型语料库上执行tf-idf启发式算法。 是否可以迭代地读取文档,并调用 vectorizer.fit()
在
每次迭代
中
?这是只考虑当前的迭代,还是记住以前的迭代? 谢谢!
浏览 16
提问于2019-01-15
得票数 2
回答已采纳
2
回答
ValueError
在
预测测试数据具有不同形状的单词向量的位置
、
、
、
sklearn.feature_extraction.text import TfidfVectorizerX_train_
tfidf
.shape clf.fit(X_train_
tfidf
,y_train) 到目前为止,只有训练集被向
浏览 1
提问于2020-07-09
得票数 1
回答已采纳
2
回答
管道
中
y变量的预拟合标准标量逆变换
、
我想要创建管道,它将在模型预测之后对y变量进行逆变换。X变量标量变换预拟合对象:-X sclrsvr模型对象:-模型实现看起来就像pipe = Pipeline(steps=[(StandardScaler(), Xsclr), (
浏览 0
提问于2020-07-24
得票数 2
1
回答
tfidf
二进制LogisticRegression分类器的sklearn图决策边界
、
、
、
、
我的目标是绘制这个LogisticalRegression分类器的决策边界,看看每个文档属于哪个类,以及
在
图上将两个类分开的边界。在此过程
中
,我想了解LogisticalRegression到底是如何处理TfidfVectorizer
中
的向量的。这是因为到目前为止我看过的所有示例都是基于只有简单标量进入分类器的假设来绘制决策边界,但在本例
中
我们有长向量(
tfidf
)...我不明白一个向量是如何转换成图上表示的单个值的(它是向量中所有分数的总和吗
浏览 16
提问于2021-03-05
得票数 0
1
回答
捕获文本
中
的特征偏移量的文本向
量器
?
、
、
、
、
我相信我需要的信息往往
在
文档的开头,所以我想以某种方式捕捉每个文档的每个特性的偏移量(第一次出现,或者所有外观的平均偏移量)。有什么向
量器
能做到吗?或者其他有效地提取这些信息的方法? 谢谢!
浏览 0
提问于2020-03-19
得票数 3
2
回答
删除词汇表
中
单个单词的出现
、
、
我试图删除
在
我的词汇表中发生一次的单词,以减少我的词汇量。我在数据框架上使用sklearn (),然后使用fit_transform函数。
tfidf
= TfidfVectorizer() 我首先想到的是
tfidf
向
量器
中
的预处理字段,或者
在
机器
学习
之前使用预处理包。
浏览 6
提问于2017-08-22
得票数 7
1
回答
检查“已安装sk-
学习
”管道仍会导致“TFIdfVectorizer尚未安装”
、
、
、
这是一个不安全感,我与sk-
学习
的管道。每当我
在
sk
中
创建一个管道-
学习
并使用这个管道做一些预测,我似乎遇到了一个问题,我不能实际检查管道的中间步骤。预测是可行的,我得到了我的分数,但是如果我想获得实例
中
的“特性重要性”,或者检查TF-下手向
量器
的特性是什么,则声称管道不合适(即使它是最近用于推理的,而且我已经对它进行了培训)。举个例子,从
Scikit-
的文档
中
调用以下代码片段的可以进行预测,但是当我想检查管道的
tfidf
时,它声称
浏览 0
提问于2020-04-15
得票数 0
1
回答
星星之火MLLib -如何重用TF-以色列国防军模型
、
、
在
将文本特征传递给分类算法之前,我使用Smarkml下手估计器/模型(TF)将文本特征转换成向量。Test data<br>Apply(Transform) model on Unseen data<br> 我
在
某个地方读到以色列国防军
在
拟合过程
中
究竟学到了什么,它可以重用来转换任何新的数据集。也许,为|D|和DF|t, D|保留相同的值,同时使用新的TF|t, D|?
浏览 0
提问于2016-11-01
得票数 4
回答已采纳
4
回答
tfidf
向
量器
和
tfidf
转换器的区别是什么?
、
、
、
、
我知道
tfidf
vectorizer的公式是我看到了
在
scikit
学习
中
存在着
tfidf
转换器,我只想区别它们。
浏览 0
提问于2019-02-18
得票数 6
回答已采纳
1
回答
如何将TfidfVectorizer的输出输入到LinearSVC分类器
中
?
、
、
我试图
在
Scikit
学习
中使用LinearSVC构建一个线性分类器。= vectorizer.fit_transform(review_corpus) 主要问题是:如何获得测试数据的矩阵表示?目前,我不知道如何从测试集中不同文档的向
量器
中
浏览 1
提问于2019-03-17
得票数 1
1
回答
如何将特性管道从
scikit-
学习
V0.21到V0.24
、
、
我正在尝试移植一个
在
scikit
中
训练的sklearn特性管道--
学习
V0.21到
scikit-
学习
V0.24,因为我没有原始的特性数据来再次训练管道。如果我使用新的数据,特征维度和位置可能与下面的模型无关,因为我
在
管道中有DictVectorizer。Pipeline(memory=None,
浏览 34
提问于2021-12-08
得票数 2
回答已采纳
3
回答
带有GridSearchCV的随机森林-- param_grid上的误差
、
、
、
我对文件进行分类,所以我也把tf-国防军的向
量器
推到管道上。confusion_matrixpipeline = Pipeline([ ('
tfidf
(
Scikit-
学习
0.17)
浏览 3
提问于2016-01-19
得票数 30
2
回答
如何使用SciKitLearn使用TfIdfVectorizer对文档进行分类?
、
、
下面的示例演示如何使用Sklearn 20新闻组数据训练分类器。>>> categories = ['alt.atheism', 'talk.religion.misc', 'comp.graphics', 'sci.space'] >>> newsgroups_train = fetch_20newsgroups(subset='trai
浏览 1
提问于2013-10-29
得票数 2
回答已采纳
1
回答
学习
多输出分类器,使用: GridSearchCV,管道,OneVsRestClassifier,SGDClassifier
、
、
我正在使用
scikit-
学习
0.18和python 3.5## SGD: support vector machine (SVM) withPipeline([ ('
tfidf
sklearn.model_selection import GridSearchCV par
浏览 0
提问于2016-11-01
得票数 14
回答已采纳
1
回答
为什么
TFIDF
在
Gensim中被视为模型
、
我熟悉
tfidf
向
量器
。为什么会这样呢?例如,
tfidf
不能只用于向量化,然后
在
LDA模型
中
输入吗?
浏览 9
提问于2018-07-25
得票数 0
回答已采纳
1
回答
如何在scikit-learn
中
归一化TF*IDF或计数?
、
、
、
我需要一种方法来标准化
tfidf
或计数向
量器
在
scikit
中
-
学习
这一点。
浏览 10
提问于2019-07-04
得票数 0
回答已采纳
1
回答
如何在两个步骤中使用TfidfVectorizer,增加分析文本的数量?
、
、
我正在研究一个文本分类问题,
在
Python3
中
,使用sklearn。我理解
Tfidf
方法还会查看其他数据集中的特性,这就是为什么我现在将TfidfVectorizer应用于旧的dataset+the新文本。但是有什么办法我可以用一种渐进的方式去做吗?
浏览 0
提问于2019-06-06
得票数 1
回答已采纳
2
回答
TF-下手向
量器
没有比countvectorizer更好的工作方式。
、
我正在使用python
学习
,
在
结果中出现了一些奇怪的东西。作为基线,我从使用countvectorizer开始,实际上正在计划使用
tfidf
向
量器
,我认为它会更好地工作。但它不..。特别是这一个得到了一个更低的性能与
tfidf
。 有人知道什么时候或者为什么
tfidf
的表现比计数差吗?我需要为我的论文正规化。
浏览 0
提问于2016-07-05
得票数 7
1
回答
如何将纯文本转换为功能/值对格式
、
、
我检查了各种svm分类器,这些分类器使用特征/值对格式进行分类。(我的重点是svmlight - )格式如下:但是当我以纯文本的形式获得用户输入时,为了使用svmlight对其进行分类,我需要将纯文本转换成这种格式。
浏览 2
提问于2014-10-01
得票数 0
1
回答
基于SVM的垃圾邮件检测综述
、
、
、
、
我的任务是将它们分类为垃圾邮件,或者不使用Python
中
的SVM。 如何将文本数据集转换为支持向量机功能?是否需要考虑其他特征,如果需要,如何将它们转换为支持向量机特征向量?
浏览 8
提问于2015-01-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本分类任务之逻辑回归
特征工程之TF-IDF
文本向量空间模型
试验仪器计量管理技术分享
通过Python进行文本数据分析和自然语言处理
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券