腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
tfidf
作为
功能
、
、
、
、
我想
使用
n-gram对两组文档进行分类。一种方法是
使用
tfidf
提取每个文档的重要单词,然后生成如下所示的csv文件: document, ngram1, ngram2, ngram3, ..., label 1, 0.0, 0.0, 0.0
浏览 30
提问于2021-02-08
得票数 0
1
回答
使用
count和
tfidf
作为
scikit learn的
功能
、
、
、
、
我正在尝试
使用
count和
tfidf
作为
多项式NB模型的特征。TfidfTransformer(use_idf=True)classifier.fit(combined_features, labels) 但是我在<e
浏览 0
提问于2014-12-03
得票数 7
2
回答
Python学习混合数据类型的分类(文本、数字、分类)
、
、
、
我正在尝试
使用
Pandas和scikit-learn在Python中执行分类。我的数据集包含文本变量、数值变量和分类变量的混合。is a description 0 Datase
浏览 1
提问于2018-10-27
得票数 5
1
回答
如何在多文本分类中添加更多的特征?
、
、
、
我
使用
product_description
作为
特性:xtrain_
tfidf
=
tfidf
_vect.transform(train_x) classifier= naive_bayes.MultinomialNB().fit(
浏览 2
提问于2020-08-10
得票数 6
1
回答
如何正确地将数字特征和文字(单词袋)结合在一起?
、
、
、
、
我
使用
了一个带有tweet数据的Spark2.2 LinearSVC模型
作为
输入:一个tweet的文本(已经进行了预处理)
作为
散列-
tfidf
,并且它的月份如下: .setNumFeatures(30000) val idf = new IDF().setInputCol("hash-tf").setOutputCol("hash-
tfidf
.setOutputCol("mont
浏览 0
提问于2018-01-07
得票数 0
回答已采纳
1
回答
tfidf
.idf_在代码中这是什么意思[closed]
、
、
改进这个问题
tfidf
= TfidfVectorizer(lowercase=False,)
tfidf
.fit _ 转换(问题) dict key:word and value:tf-idf score压缩= word2
tfidf
(压缩(
tfidf
.get _
功能
_ 名称()、
tfidf
.idf _ ))
浏览 59
提问于2021-02-28
得票数 0
回答已采纳
0
回答
如何在
tfidf
矩阵中添加以下
功能
?
、
我正在
使用
TfidfVectorizer生成一个模型,如下所示:然后我想向这个名为
tfidf
2的矩阵添加新
功能
,我有一个列表,如下所示: dates=['010000000000', '001000000000', '001000000000该列表具有与list_cluster相同的长度,并表示日期有12个位置
浏览 0
提问于2016-12-27
得票数 0
回答已采纳
1
回答
SKLearn:在
使用
TfidfVectorizer时丢失列名
、
生成的dataframe应该将每个单词
作为
列名。以下是我的尝试:
tfidf
_transformer = TfidfVectorizer(min_df=1, ngram_range=(1,1), use_idf=True)
tfidf
_df = pd.DataFrame(
tfidf
_df.toarray()) print'
tfidf</
浏览 5
提问于2017-07-31
得票数 1
回答已采纳
1
回答
如何形成基于
tfidf
sparklyr dataframe的词汇
、
、
、
、
必须建立一个Tf-以色列国防军矩阵/数据基,以术语/词
作为
列名,而不是
使用
sparklyr的索引。我之所以选择ft_count_vectorizer,是因为它提供了存储词汇表的
功能
。clean_words",output_col="tffeatures")%>%
tfidf
是一个spark_tbl类,它还包括c
浏览 0
提问于2018-07-08
得票数 0
回答已采纳
1
回答
我们如何利用多项朴素贝叶斯的
TFIDF
向量?
、
、
比方说,我们
使用
TFIDF
转换将文档编码成连续值的特性。贝努利朴素-贝叶斯已经过时了,因为我们的
功能
不再是二进制的了。似乎我们也不能
使用
多项朴素贝叶斯,因为这些值是连续的,而不是绝对的。据我所知,似然函数本身假定我们正在处理离
浏览 1
提问于2017-04-05
得票数 2
2
回答
如何用tf-国防军对新文件进行分类?
、
、
、
、
如果我
使用
来自TfidfVectorizer的sklearn生成特征向量,如下所示:feature_names = TfidfVectorizer.get_feature_names() 然后根据feature_names计算新文档的术语频率。
浏览 5
提问于2016-10-18
得票数 9
回答已采纳
1
回答
Sklearn - TfidfVectorizer未能捕捉到一个字母单词
、
、
、
、
### Create the vectorizer methodtext_
tfidf
=
tfidf
_vec.fit_transform(title_text)
浏览 1
提问于2020-10-30
得票数 2
回答已采纳
1
回答
用LightGBM进行python文本古典化
、
、
、
CountVectorizer(ngram_range=(1,2), stop_words=stopwords1)X_train_
tfidf
=
tfidf
_transformer.fit_transform(X_train_
浏览 1
提问于2018-05-09
得票数 4
1
回答
有没有办法
使用
sklearn TF-IDF模型来解决单词类比问题?
、
、
我已经
使用
Python的sklearn库
使用
我自己的数据集拟合了TF-IDF模型:
tfidf
_featuriser = sklearn.feature_extraction.text.TfidfVectorizer(stop_words=None)
tfidf
_docterm_matrix =
tfidf
_featuriser.transform(documents) 我正在尝试解决单词类比(男人::国王
作为</e
浏览 21
提问于2021-02-09
得票数 2
回答已采纳
1
回答
将tf-idf值
作为
矩阵中的列添加
、
、
、
sklearn.feature_extraction.text import TfidfVectorizer
tfidf
= TfidfVectorizer() new_list=[] new_list.append(
tfidf<
浏览 2
提问于2018-06-22
得票数 1
1
回答
在每一份文件/总数中,哪10个词的TF-以色列国防军值最高?
、
、
、
、
我正试图得到每个文档最高的TF-以色列国防军分数为10的单词。 它有500多行,我很好奇每一行中最重要的单词。from sklearn.feature_extraction.text import TfidfVectorizervectors = vectorizer.fit_transform(df['liststring']) feature_names = vectori
浏览 1
提问于2020-11-08
得票数 2
回答已采纳
1
回答
如何计算精度和F1?
、
、
我
使用
TF_IDF
作为
特征选择和朴素贝叶斯分类器。我想计算出总精度和精度。, train_y, xvalid_
tfidf
) accuracy = train_model(naive_bayes.MultinomialNB(), xtrain_
tfidf
_ngram, train_y,IDF Vectors a
浏览 4
提问于2020-07-18
得票数 3
2
回答
将附加数据组合到我的
TFIDF
数组中
、
、
、
、
起初,我只
使用
文本的
tfidf
数组
作为
特性。= vectorizer.transform(X_train)到目前为止,代码运行正常。因此,除了我的
tfidf
矩阵之外,我还想用我的新特性添加这个列(id_1),这样我就可以把它
作为
一个参数来训练模型。= vectorizer.transform(X_train) X_test_
tfidf
= vectorizer.transfor
浏览 6
提问于2020-05-15
得票数 0
回答已采纳
1
回答
“第一个参数必须是字符串或已编译的模式”错误在tf-国防军向量器中
、
、
、
、
dfff是一个已经被标记的数据文件,它将被
使用
tfidfvectorizer转换为tf-国防军。然后我运行了以下代码:
tfidf
_array = np.array(
tfi
浏览 3
提问于2021-11-02
得票数 0
2
回答
我如何
使用
TF*国防军分数
作为
我的机器学习模型?
、
、
我打算用这些
作为
我的logistic回归模型进行分类。如何将这些值准确地输入到算法中?
浏览 0
提问于2019-03-23
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用心跳作为密码
使用Gitee作为Markdown的图床
java数组作为方法参数的使用
React Native 将使用 Hermes 作为默认 JavaScript 引擎
使用 GraphQL 作为 API 网关来监控微服务
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券