我有一个二进制分类任务,其规范如下:
输入:文本块(不超过几个句子,大部分是一个句子)。
附加输入:对于每个输入样本都有可用的附加信息(这也是一些长度相似的文本,最多2-3句)。
问题:使用附加上下文对文本内容进行分类
问题类型:二进制分类
从本质上讲,任务可以归结为对内容进行分类,内容取决于上下文或p(Content可比上下文)。
我在想用深层神经网络对文本进行编码以进行分类的有效方法。我搜索了最近的作品,但现有的文献大多使用下面提到的技术。
我想知道是否有更好的方法来编码上下文?它已经证明在某些领域是有效的,而不是仅仅的级联。
编码然后级联:这涉及使用类似于内容的方式对上下文进行编码,然后在分类之前将特征表示连接起来。这是广泛使用的技术。这种技术有很多变体(例如使用tfidf rep、word embedding、LSTMs、CNN等编码文本的方法)。
在分类过程中是否有更好的方法来获取上下文信息?
递归RNN是关于我的TODO的东西。
https://datascience.stackexchange.com/questions/37321
复制相似问题