让我们想象一下,我有一个带有注释情感的电影评论数据集:
-1 means negative
0 means neutral
+1 means positive
我看到很多人试图用分类来解决这些问题,但是不应该用回归来代替吗?对我来说,使用回归可以让系统建立标签之间存在转换的模型,例如0在两者之间。对此有什么想法吗?
我是LSTM的新手,所以我尝试用Keras编写一个简单的情感分类脚本。然而,我无法理解输出。
这是我的情感分类代码:
import keras
from keras.models import Sequential
from keras.layers import Dense, Activation, LSTM, Embedding
from keras.callbacks import EarlyStopping, ModelCheckpoint
es = EarlyStopping(monitor='val_loss', patie
使用mahout,我能够对数据的情感进行分类。但是我被困在了一个混乱的矩阵中。
我正在使用mahout 0.7朴素贝叶斯算法来对推文的情绪进行分类。我使用trainnb和testnb朴素贝叶斯分类器来训练分类器,并将推文的情绪分类为“积极”、“消极”或“中性”。
样本正训练集
'positive','i love my i phone'
'positive' , it's pleasure to have i phone'
同样,我也准备了负性和中性的训练样本,这是一个巨大的数据集。
我提供的样本测试数
我一直在搜索如何在google natural language API中创建一个新的实体,但什么也没有找到。有没有人可以帮助我创建一个新的分类器,这样如果我传递一个句子,并且我想检测假设'python‘作为编程语言,那么我将如何获得它。当前API将'python‘作为'other’。
我还研究了cloud auto ml api作为我的解决方案,并试图创建和训练一个模型,但它只能做情感分析,而不是实体detection.It给我的分数,而不是告诉我Java是编程语言。
感谢advance.Your帮助,我们将不胜感激。
我得到的数据大多是tweet或小评论(300-400个字符)。我使用了词袋模型并使用了NaiveBayes分类。现在我有很多错误分类的案例,都是下面提到的类型:
1.] He sucked on a lemon early morning to get rid of hangover.
2.] That movie sucked big time.
现在的问题是,在情感分类过程中,两个人都因为“糟糕”这个词而变得“消极”。
Sentiment Classification : 1.] Negative 2.] Negative
类似地,在文档分类过程中,由于单词"sucked“的存在,
我想知道是否有任何方法来可视化或找到最重要/最重要的特性,在安装MLP分类器后,在Sklearn。
简单的例子:
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import LeaveOneOut
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from skle