首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >密集文本表示

密集文本表示
EN

Data Science用户
提问于 2015-12-21 06:50:07
回答 1查看 245关注 0票数 1

我做了大量的谷歌搜索,但找不到一篇论文,提出了一种算法,将产生密集的特征向量,为简短的文本输入。我很乐意找到一种特征提取算法,它的性能至少与稀疏词、单字和双字形特征向量一样好。

目前,我正在探索使用LDA (潜在Dirichlet分配)的想法,但是在处理短文本(每个文档2-7个单词)方面存在问题。

手头的任务是简短的文本分类。我的数据的类数从10个到20个不等。类表示得相当好,单词unigram和bigram特性都很好地工作。我想为其他实验计算密集的特征向量。

任何文件的指针,最好是简单的实施,将不胜感激。

EN

回答 1

Data Science用户

发布于 2017-02-14 15:49:46

在我的工作中,我们已经取得了一些成功,仅仅使用经过预先训练的嵌入的平均值(例如,GloVe向量)来对短文本进行分类。你试过吗?

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/9456

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档