我是这个领域的初学者。我有一个废弃的评论数据集。它包含审查套接字(1-10)和审查内容。我将根据评论分数给评论贴上如下标签:
0-2 ->阴性,3-6 ->中性,7-10 ->阳性
有可能直接贴上这样的标签吗?是否有任何具体的程序来做到这一点?我需要验证我的标签吗?
发布于 2021-06-23 10:11:33
有可能直接贴上这样的标签吗?是否有任何具体的程序来做到这一点?我需要验证我的标签吗?
是的,用这种方式来定义情感类是绝对可能的。人们可以合理地假设复习分数是对复习情绪的一个很好的近似。
这只是一种定义金本位的方法,并没有具体的过程。重要的是要认识到,定义金本位是设计任务本身的一个重要部分,而不是设计一个试图解决任务的系统。
在某些情况下,证明作为黄金标准的任何东西都与任务的目标相对应是有意义的,但在这种情况下,它是简单明了的:可以放心地假设,编写评论的用户将一个与其总体情绪相对应的值作为得分。
即使这是一个合理的设计,注意到这些限制也很重要:
请注意,情感分析不一定是一个分类任务(预测一个分类变量),它也可以定义为一个回归任务(预测一个数值变量)。在这种情况下,目标变量可以是分数本身,这将避免上面提到的一些问题。这也是一种设计选择,主要取决于应用程序的用途。
https://datascience.stackexchange.com/questions/96977
复制相似问题