我希望从列表中的每个字典中提取request_text字段,并构造一个字符串的单词表示包(string to count- list )。下一步是训练一个logistic回归分类器来预测变量“requester_received_pizza”。我想训练90%的数据,预测10%的数据。问题是我不知道如何预测10%。任何建议都是有帮助的!import json
from sklearn.cross_validation import tr
我尝试使用lasso logistic回归(在sklearn中,LogisticRegression(罚值=‘l1’))进行分类,它自动地将一些特征系数设置为0,从而为我执行某种特征选择。LogisticRegression()的sklearn实现使用‘one- of rest’执行多类分类。也就是说,它训练三个独立的分类器来预测一个特定的类和另两个类,然后将每个数据点分配给预测器给出的概率最高的类。
在所有三个分类器中,我的数据集中的一些特征的系数被
我尝试了ANN、SVM、logistic回归等几种模型,并对模型进行了训练和检验。y_train, y_test = train_test_split(x, y, test_size=0.25, from sklearn.linear_model import LogisticRegression
classifier = LogisticRegressionimport c