# 导入需要使用的模块
from sklearn.datasets import make_classification
# 创建数据X和标签y
X, y = make_classification(n_sample=xx, n_classes= xx, n_features = xx, n_redundant=xx, random_state=xx)
# 导入需要使用的模块
# 以模型为单位进行模块的导入
from sklearn.linear_model import LogisticRegression
from sklearn.svm import LinearSVC,SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
# 构建模型
model = Classifier() # Classifier()需要更换为实际的模型
# 对模型进行训练
model.fit(train_X,train_y)
# 使用模型对数据进行预测
model.predict(test_X)
# 模型的准确率
# 准确率是使用(模型预测的分类与实际的分类相同的数据的数量)/(数据的总数量)公式计算出来的
model.score(test_X,test_y)
Classifier()举例:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_classification
# 创建数据X和标签y
X, y = make_classification(n_samples=100, n_features = 2, n_redundant=0, random_state=42)
# 将数据划分为用于学习的部分和用于评估的部分
train_X, test_X, train_y, test_y = train_test_split(X, y, random_state=42)
# 构建模型
model = LogisticRegression(random_state=42)
# 对模型进行训练
model.fit(train_X,train_y)
# 使用模型对数据进行预测
model.predict(test_X)
# 模型的准确率
# 准确率是使用(模型预测的分类与实际的分类相同的数据的数量)/(数据的总数量)公式计算出来的
model.score(test_X,test_y)