首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为文本分类编码上下文的方法?

为文本分类编码上下文的方法?
EN

Data Science用户
提问于 2018-08-22 21:27:07
回答 1查看 932关注 0票数 2

我有一个二进制分类任务,其规范如下:

输入:文本块(不超过几个句子,大部分是一个句子)。

附加输入:对于每个输入样本都有可用的附加信息(这也是一些长度相似的文本,最多2-3句)。

问题:使用附加上下文对文本内容进行分类

问题类型:二进制分类

从本质上讲,任务可以归结为对内容进行分类,内容取决于上下文或p(Content可比上下文)。

我在想用深层神经网络对文本进行编码以进行分类的有效方法。我搜索了最近的作品,但现有的文献大多使用下面提到的技术。

我想知道是否有更好的方法来编码上下文?它已经证明在某些领域是有效的,而不是仅仅的级联。

编码然后级联:这涉及使用类似于内容的方式对上下文进行编码,然后在分类之前将特征表示连接起来。这是广泛使用的技术。这种技术有很多变体(例如使用tfidf rep、word embedding、LSTMs、CNN等编码文本的方法)。

在分类过程中是否有更好的方法来获取上下文信息?

递归RNN是关于我的TODO的东西。

EN

回答 1

Data Science用户

发布于 2018-10-02 05:25:44

递归神经网络(RNN)最适合解决你的问题。如果您想更进一步,请尝试递归神经张量网络。您可以使用RNN为内容和上下文数据生成完整句子的作文。这将帮助您将句子映射到更高的维度空间,并且作为输出,您将获得内容和上下文的数值(或嵌入)。将这些值输入一个简单的逻辑分类器将完成您的任务。有关RNN的简要概述,请看一下Richard的这个讲课

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/37321

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档