首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用线性/增量主题对文本文档进行分类

使用线性/增量主题对文本文档进行分类
EN

Data Science用户
提问于 2015-09-17 18:11:38
回答 1查看 219关注 0票数 0

我试图使用几个不同的维度对文本文档进行分类。我试图创建任意的主题来分类,比如大小和相关性,它们是线性的或渐进的。例如:

尺寸:小,小,中,大,大。相关性:坏的,好的,太棒了

我正在用手训练分类器。例如,这个文档代表一个“小”的东西,另一个文档正在讨论一个‘大’的东西。当我尝试多标签或多类支持向量机时,它不能很好地工作,而且逻辑上也不合理。

我应该使用哪种模型来帮助我预测这种线性类型的数据?我现在用的是一个单词的tfidf向量来学习。

EN

回答 1

Data Science用户

回答已采纳

发布于 2015-09-17 18:41:18

如果您希望这些输出维度是连续的,只需将您的大小和相关性指标转换为实际值目标即可。然后,您可以使用各种模型中的任何一个来执行回归而不是分类。你甚至可以尝试训练一个多目标神经网络来同时预测所有这些输出。

此外,您还可以考虑首先使用主题模型 (如LDA )作为您的功能空间。

基于这些值,听起来“相关性”可能是一个变量,最好由情感分析的技术来捕捉。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/8114

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档