在Python中,进行多元线性回归通常使用scikit-learn
库
pip install numpy pandas scikit-learn
pandas
库创建DataFrame。import numpy as np
import pandas as pd
# 生成虚拟数据
data = {
'特征1': np.random.rand(100),
'特征2': np.random.rand(100),
'目标变量': np.random.rand(100)
}
dataset = pd.DataFrame(data)
train_test_split
函数实现这一点。from sklearn.model_selection import train_test_split
X = dataset[['特征1', '特征2']] # 特征
y = dataset['目标变量'] # 目标变量
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
y_pred = regressor.predict(X_test)
mean_squared_error
和R^2
分数来评估模型的性能。from sklearn.metrics import mean_squared_error, r2_score
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print("均方误差 (MSE):", mse)
print("R^2 分数:", r2)
现在,您已经成功地使用Python进行了多元线性回归分析。可以根据需要调整特征和数据集以适应您的实际问题。
领取专属 10元无门槛券
手把手带您无忧上云