

2025 年 9 月 9 日,Scikit-learn 官方宣布正式发布 1.7.2 版本。 这一版本主要包含几个重要的 Bug 修复,并且是 首个支持 Python 3.14 的版本。
本次更新主要内容如下:
sklearn.composecompose.TransformedTargetRegressor 在将目标变量进行转换后,现在会将维度保持与原目标相同,再传递给回归器。
此修复确保了在目标维度一致性方面的稳定性,避免了某些回归模型在输入维度不一致时出现错误。sklearn.feature_extractionfeature_extraction.FeatureHasher 和 feature_extraction.text.HashingVectorizer 设置了标签 requires_fit=False。
这意味着这两个类在使用时 无需显式调用 fit,可以直接进行数据转换,符合其无状态(stateless)特性。sklearn.imputeimpute.SimpleImputer 使用 strategy="most_frequent" 策略时,如果数据中存在多个值并列为最高频率且数据类型为混合类型时,之前版本会出现 bug。
本次更新修复了该问题,确保此类情况下的插补结果正确。sklearn.linear_modellinear_model.LogisticRegressionCV 或 linear_model.LogisticRegression 中使用 solver="newton-cholesky" 解决多分类问题,并且启用了 warm_start=True 时,如果 fit_intercept=True 或 penalty=None(即无正则化参数),原始的 warm start 提供的最后一类的系数和截距可能会被错误地覆盖为 0。
本次更新修复了该问题,确保 warm start 的参数能够正确保留和应用。sklearn.pipelinepipeline.FeatureUnion 中,新增校验逻辑,要求所有的子转换器必须返回 二维输出(2D array)。
如果某个转换器返回的是一维输出(1D array),会抛出明确的错误提示,防止之前悄无声息地产生无意义的拼接结果。使用 pip 升级: .
pip install -U scikit-learn使用 conda-forge 安装: .
conda install -c conda-forge scikit-learn本次 scikit-learn 1.7.2 版本虽然是一次小版本更新,但包含了多个在日常开发中可能影响结果的关键 bug 修复,同时也是首个支持 Python 3.14 的版本。建议使用 scikit-learn 的开发者和数据科学从业者尽快升级,以获得更高的稳定性和兼容性。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。