发布
社区首页 >问答首页 >NLP方面挖掘方法

NLP方面挖掘方法
EN

Stack Overflow用户
提问于 2017-08-06 18:19:54
回答 1查看 435关注 0票数 0

我试图实现的方面矿工在亚马逊的消费者评论,耐久洗衣机,冰箱。这个想法是输出情感极性的方面,而不是整个句子。例如:“食物是好的,但服务是坏的”,评论必须输出食物是积极的,服务是消极的。我阅读了Richard关于RNTN模型的文章,用于细粒度的情感分类器,但我想我需要手动标记针对不同领域的短语的情感,并创建自己的树状库以获得更高的准确性。

这是我想到的另一种方法。有人能用你的反馈来验证/指导我吗?把这个方法分解成两个子任务。1)识别方面2)识别情感

识别方面

  1. 使用POS标签识别所有名词。这应该在评审中列出潜在的所有方面。
  2. 使用这些名词的word2vec来确定相似的名词并缩小数据集的大小

识别情感

  1. 在评级为1,2,4,5的评论上训练CNN或密集网络模型(忽略3,因为我们需要具有极性的数据)
  2. 将测试集评论分解为短语(如“食物很好”),然后使用上述模型对其进行评分。
  3. 找到第一个子任务中确定的方面,并将它们标记到各自的短语中。
EN

回答 1

Stack Overflow用户

发布于 2017-08-06 21:18:09

我不知道如何回答这个问题,但有几点建议:

  1. 看看神经网络文献中的多任务学习,并尝试一个用于多任务的end2end神经网络。
  2. 使用预先训练过的单词向量(如w2v或glov )作为输入。
  3. 当你使用互联网数据时,不要依赖pos,
  4. 在您的设计中找到一种表示您的名称实体和oov的方法。
  5. 不要忽视3!
  6. 您应该定期对一些数据进行注释。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45535181

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档