如何在自然语言处理中以%计算数据的准确性?
试图找出电影评论数据的准确性
一旦新的电影评论来了,决定评论是否是正面的,过程如下所示
为了训练目的,使用了大小为400 MB的电影评审文件,其中包含200 K+的评论和相应的分级。
根据文件中的评分,实现了字包法,例如:如果评分>5,就把它放进好的袋子里,否则不好的包
在实现以下NLP技术中使用的单词包方法时
一旦袋子准备好了,按照上面所说的使用NLP技术进行新的评论,然后在袋子中查找计算好的和坏的袋子上的平均值,不管是好的还是坏的,以决定新的审查是否是积极的为基础。
请建议如何用%计算准确度?
发布于 2017-07-04 13:06:10
将您的数据分成训练和测试集。然后,您可以评估(以%计算的准确性)您的模型在您的培训集在您的测试。为了取得更可靠的结果,你可以用交叉评估的方式来评价你的方法.
https://stackoverflow.com/questions/44797112
复制相似问题