类别
Cleanliness
Customer Service
Parking
Billing
Food Pricing
Food Quality
Waiting time
Unspecified评论包含多个类别,所以我使用了多分类。但我对如何处理积极/消极的事情感到困惑。范例审查可能对食品质量是积极的,但对客户服务是消极的。Ex- food taste was very good but staff behaviour was very bad. so review contains positive food quality but negative Customer service我该如何处理这种情况?分类前要做情感分析吗?请帮帮我
发布于 2017-08-03 04:22:01
我认为你的数据与Restaurants reviews非常相似。它包含大约100条评论,每个评论中都有不同数量的方面术语(More information)。因此,您可以像这样使用基于方面的情绪分析:
1-方面术语提取
从评论中提取方面术语。
两方面极性检测
对于句子中的一组给定体术语,确定每个体术语的极性是否为正、负。
3-识别特征类别
给定一组预定义的方面类别(例如,食品质量、客户服务),识别给定句子中讨论的方面类别。
4-确定极性
给定一组预先识别的方面类别(例如,食品质量、客户服务),确定每个方面类别的极性(正、负)。
有关类似项目的更多信息,请参阅this。
我希望这能对你有所帮助。
发布于 2017-08-02 19:49:52
是的,你需要一个情绪分析。你为什么不为你的数据创建标记,也就是从句子中找到所需的单词,现在最可能的方法是找到相关的单词和它们的情感。即食物很好,但不太干净
在这种情况下,你有食物,好的,干净的,不合适的,现在食物与它的下一个术语链接,清洁到它的下一个术语“不合适”
同样,您可以将其中任何一个分类为两个类别,即1,0代表好的和坏的。或者,您可以根据自己的情况添加类。那么你就会有这样的数据:
--------------------
FEATURE | VAL
--------------------
Cleanliness 0
Customer -1
Service -1
Parking -1
Billing -1
Food Pricing -1
Food Quality 1
Waiting time -1
Unspecified -1我给出了一个例子,其中-1,1,0分别表示没有评论,好的和坏的。你可以添加更多的类别,如0,1,2坏的,相当好的我可能在回答这个问题上不是很好,但这是我的感觉。
注意:你需要明白,你的模型不可能是完美的,因为这就是机器学习的全部内容,你肯定是错的。你的模型不能给出一个完美的分类,它必须对某些输入是错误的,它会随着时间的推移学习并改进。
发布于 2017-08-02 07:25:09
有许多方法可以进行多标签分类。
最简单的方法是为每个类建立一个模型,如果评论达到了该标签的某个阈值分数,您就可以将该标签应用于评论。
这将独立对待这些类,但它似乎是解决问题的好方法。
https://stackoverflow.com/questions/45396394
复制相似问题