将logistic回归和连续回归与scikit-learn相结合

Logistic回归和连续回归是两种常见的回归分析方法，它们在机器学习和数据分析中有着广泛的应用。Scikit-learn是一个强大的Python库，提供了大量的机器学习算法和工具，可以方便地将这些算法应用于实际问题中。

Logistic回归

基础概念： Logistic回归是一种用于分类问题的线性模型。它通过使用逻辑函数（S形函数）将线性回归的输出转换为介于0和1之间的概率值，从而进行二分类或多分类。

优势：

简单且易于实现。
输出结果为概率值，便于解释。
对于线性可分的数据集效果较好。

类型：

二分类Logistic回归。
多分类Logistic回归（通常使用softmax函数）。

应用场景：

信用评分。
医疗诊断。
垃圾邮件检测。

示例代码：

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建Logistic回归模型
model = LogisticRegression(max_iter=200)

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估模型
accuracy = model.score(X_test, y_test)
print(f"Accuracy: {accuracy}")

连续回归

基础概念：连续回归（通常指线性回归）是一种用于预测连续数值输出的模型。它通过拟合数据点之间的线性关系来进行预测。

优势：

简单直观。
计算效率高。
适用于大多数线性关系较强的数据集。

类型：

简单线性回归（一个自变量）。
多元线性回归（多个自变量）。

应用场景：

房价预测。
销售量预测。
股票价格预测。

示例代码：

from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split

# 生成回归数据集
X, y = make_regression(n_samples=100, n_features=1, noise=20, random_state=42)

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_id=42)

# 创建线性回归模型
model = LinearRegression()

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估模型
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")