【机器学习sklearn实战】计算偏差和方差

文章来源：企鹅号 - 程序员的自我救赎

采用mlxtend可以很方便的计算Bias-Variance误差分解，下面是回归决策树方法的偏差-方差分解。

from mlxtend.evaluate import bias_variance_decomp

from sklearn.tree import DecisionTreeRegressor

from mlxtend.data import boston_housing_data

from sklearn.model_selection import train_test_split

X, y = boston_housing_data()

X_train, X_test, y_train, y_test = train_test_split(X, y,

test_size=0.3,

random_state=123,

shuffle=True)

tree = DecisionTreeRegressor(random_state=123)

avg_expected_loss, avg_bias, avg_var = bias_variance_decomp(

tree, X_train, y_train, X_test, y_test,

loss='mse',

random_seed=123)

print('Average expected loss: %.3f' % avg_expected_loss)

print('Average bias: %.3f' % avg_bias)

print('Average variance: %.3f' % avg_var)

输出结果为：

Average expected loss: 31.536

Average bias: 14.096

Average variance: 17.440

作为对比，下面是Bagging方法的偏差-方差，可以看出采用Bagging方法可以降低variance。

from sklearn.ensemble import BaggingRegressor

tree = DecisionTreeRegressor(random_state=123)

bag = BaggingRegressor(estimator=tree,

n_estimators=100,

random_state=123)

avg_expected_loss, avg_bias, avg_var = bias_variance_decomp(

bag, X_train, y_train, X_test, y_test,

loss='mse',

random_seed=123)

print('Average expected loss: %.3f' % avg_expected_loss)

print('Average bias: %.3f' % avg_bias)

print('Average variance: %.3f' % avg_var)

输出结果为：

Average expected loss: 18.620

Average bias: 15.460

Average variance: 3.159

发表于: 14小时前2024-08-06 17:28:50
原文链接：https://page.om.qq.com/page/OrgFcRa-MGv99AI5pvawGNSA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

【机器学习sklearn实战】计算偏差和方差

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐