LightGBM中的num_leaves选择？_lightgbm中的Pred_leaf_理解python lightGBM实现中的“预测”函数输出 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

LightGBM大战XGBoost，谁将夺得桂冠？

A.机器学习入门算法[七]：基于英雄联盟数据集的LightGBM的分类预测

本项目链接：https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc

数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测

因为文档是去年弄的，很多资料都有点找不到了，我尽可能写的详细。后面以2021年研究生数学建模B题为例【空气质量预报二次建模】再进行一个教学。

LightGBM实战

[LightGBM] [Warning] No further splits with positive gain, best gain: -inf [LightGBM] [Warning] No further splits with positive gain, best gain: -inf [99] valid_0's multi_logloss: 0.264218 [LightGBM] [Warning] No further splits with positive gain, best gain: -inf [LightGBM] [Warning] No further splits with positive gain, best gain: -inf [LightGBM] [Warning] No further splits with positive gain, best gain: -inf [100] valid_0's multi_logloss: 0.264481 [0, 1, 1, 0, 2, 1, 2, 0, 0, 2, 1, 0, 2, 1, 1, 0, 1, 1, 0, 0, 1, 1, 2, 0, 2, 1, 0, 0, 1, 2] 0.9666666666666667

100天搞定机器学习|Day63 彻底掌握 LightGBM

LightGBM 全称为轻量的梯度提升机(Light Gradient Boosting Machine)，由微软于2017年开源出来的一款SOTA Boosting算法框架。

工程能力UP！| LightGBM的调参与并行

【这里必须说一下，lightbg的参数的同义词实在太多了，很多不同的参数表示的是同一个意思，不过本文中使用“/”分开】

机器学习实战 | AutoML自动化机器学习建模

教程地址：http://www.showmeai.tech/tutorials/41

机器学习系列入门系列七：基于英雄联盟数据集的LightGBM的分类预测

本项目链接：https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc

python - 机器学习lightgbm相关实践

相关文章： R+python︱XGBoost极端梯度上升以及forecastxgb（预测）+xgboost（回归）双案例解读 python︱sklearn一些小技巧的记录（训练集划分/pipelline/交叉验证等）

数据挖掘实践（金融风控）：金融风控之贷款违约预测挑战赛（下篇）xgboots/lightgbm/Catboost等模型--模型融合：stacking、blend

通过组合多个学习器来完成学习任务，通过集成方法，可以将多个弱学习器组合成一个强分类器，因此集成学习的泛化能力一般比单一分类器要好。

开源|LightGBM基本原理，以及调用形式

久前微软 DMTK (分布式机器学习工具包)团队在 GitHub 上开源了性能超越其他 boosting 工具的 LightGBM 知乎上有近千人关注“如何看待微软开源的 LightGBM？”问题，被评价为“速度惊人”，“非常有启发”，“支持分布式”，“代码清晰易懂”，“占用内存小”等。 GBDT ：　　GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型，其主要思想是利用弱分类器（决策树）迭代训练以得到最优模型，该模型具有训练效果好、不易过拟合

在lightgbm中使用交叉验证

防止过拟合的参数： max_depth 树的深度，不要设置的太大； num_leaves 应该小于 2^(max_depth)，否则可能会导致过拟合； min_child_samples 较大的值可以避免生成一个过深的树, 避免过拟合，但有可能导致欠拟合； min_sum_hessian_in_leaf 设置较大防止过拟合； feature_fraction 和 bagging_fraction都可以降低过拟合；正则化参数lambda_l1(reg_alpha), lambda_l2(reg_lambda)。

「建模调参」之零基础入门数据挖掘

摘要：对于数据挖掘项目，本文将学习如何建模调参？从简单的模型开始，如何去建立一个模型；如何进行交叉验证；如何调节参数优化等。

LightGBM+Optuna 建模自动调参教程！

在kaggle机器学习竞赛赛中有一个调参神器组合非常热门，在很多个top方案中频频出现LightGBM+Optuna。知道很多小伙伴苦恼于漫长的调参时间里，这次结合一些自己的经验，给大家带来一个LGBM模型+OPTUNA调参的使用教程，这对可谓是非常实用且容易上分的神器组合了，实际工作中也可使用。

NN和树模型通吃的调参神器Optuna！

本文介绍的一种超参寻优策略则同时解决了上面三个问题，与此同时，该方法在目前kaggle的数据竞赛中也都是首选的调参工具包，其优势究竟有多大，我们看一下其与目前最为流行的一些工具包的对比。

数据挖掘神器LightGBM详解

这些系统下的 XGBoost 安装，大家只要基于 pip 就可以轻松完成了，在命令行端输入命令如下命令即可等待安装完成。

大战三回合：XGBoost、LightGBM和Catboost一决高低 | 程序员硬核算法评测

【导读】XGBoost、LightGBM 和 Catboost 是三个基于 GBDT（Gradient Boosting Decision Tree）代表性的算法实现，今天，我们将在三轮 Battle 中，根据训练和预测的时间、预测得分和可解释性等评测指标，让三个算法一决高下！

探索LightGBM：监督式聚类与异常检测

监督式聚类和异常检测是在监督学习框架下进行的一种特殊形式的数据分析技术。在Python中，LightGBM提供了一些功能来执行监督式聚类和异常检测任务。本教程将详细介绍如何使用LightGBM进行监督式聚类和异常检测，并提供相应的代码示例。

【数据竞赛】Kaggle GM秘技：树模型初始化技巧

作者: 尘沙樱落树模型初始化技巧大家都知道神经网络训练的提升分数的技巧之一就是：依据验证集合的效果，来调整learning rate的大小，从而获得更好的效果; 但我们在训练树模型的时候却往往

模型融合与超参数优化

一般来说，通过融合多个不同的模型，可能提升机器学习的性能，这一方法在各种机器学习比赛中广泛应用，常见的集成学习&模型融合方法包括：简单的Voting/Averaging（分别对于分类和回归问题）、Stacking、Boosting和Bagging。

刷分神器，使用hyperopt实现lightgbm自动化调参！

Hyperopt是最受欢迎的调参工具包，目前在github上已经获得star数量5.8k，在kaggle天池等比赛中经常出现它的身影。

pyqlib平台：微软开发的量化投资平台

介绍官网：https://github.com/microsoft/qlib 是面向AI的金融量化平台、实现其潜在的价值，创造AI在量化投资的价值。包括全部的机器学习中的数据处理、模型训练、回测；以及量化投资的Alpha 预测、风险模型、市场动态性建模、操作顺序等。使用Qlib可以快速的实现想法到量化投资的策略。 📷 最底层的是基础架构层（Infrastructure）。Qlib 的数据服务模块（Data Server）提供了高性能的数据存储设计，让 AI 算法可以更快地处理更多金融数据

Kaggle神器LightGBM最全解读！

GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型，其主要思想是利用弱分类器（决策树）迭代训练以得到最优模型，该模型具有训练效果好、不易过拟合等优点。GBDT不仅在工业界应用广泛，通常被用于多分类、点击率预测、搜索排序等任务；在各种数据挖掘竞赛中也是致命武器，据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。而LightGBM（Light Gradient Boosting Machine）是一个实现GBDT算法的框架，支持高效率的并行训练，并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。

机器学习项目：使用Python进行零售价格推荐

日本最大的社区购物应用Mercari遇到了一个问题。他们希望向卖家提供定价建议，但这很难，因为他们的卖家能够在Mercari上放置任何东西。

【机器学习】集成学习代码练习

课程完整代码：https://github.com/fengdu78/WZU-machine-learning-course

【机器学习】集成学习代码练习（随机森林、GBDT、XGBoost、LightGBM等）

对比了六大模型，可以看出，逻辑回归速度最快，但准确率最低。而LightGBM，速度快，而且准确率最高，所以，现在处理结构化数据的时候，大部分都是用LightGBM算法。

算法集锦（17） | 推荐系统 | 基于机器学习的商品定价系统

Mercari是日本最大的社区购物应用程序，其深知一个问题，就是想给卖家提供定价建议非常困难。因为卖家可以在Mercari的市场上放置任何东西。

【机器学习】随机森林、GBDT、XGBoost、LightGBM等集成学习代码练习

尝鲜！微软首个AI量化投资开源平台Qlib上手体验！

近日，微软亚洲研究院正式发布了业内首个AI量化投资开源平台Qlib，发布一个月以来已经在GitHub收获2.3k+star！

【 SPA 大赛】win10 python3.5.X 下开启 lightgbm 支持

本文介绍了LightGBM库，它是一个快速、分布式、高性能的梯度提升框架，支持分类和回归任务。LightGBM采用基于决策树的算法，具有高速、高精确度、可扩展性等特点。同时，文章还介绍了如何安装和配置LightGBM，以及如何使用LightGBM进行数据建模和预测。

Feature Engineering 特征工程 1. Baseline Model

预测任务：用户是否会下载APP，当其点击广告以后数据集：ks-projects-201801.csv

30分钟学会LightGBM

LightGBM可以看成是XGBoost的升级加强版本，2017年经微软推出后，便成为各种数据竞赛中刷分夺冠的神兵利器。

剑指LightGBM和XGboost！斯坦福发表NGBoost算法

Stanford ML Group 最近在他们的论文中发表了一个新算法，其实现被称为 NGBoost。该算法利用自然梯度将不确定性估计引入到梯度增强中。本文试图了解这个新算法，并与其他流行的 boosting 算法 LightGBM 和 XGboost 进行比较，以了解它在实践中是如何工作的。

剑指LightGBM和XGboost！斯坦福发表NGBoost算法

模型建立与调参

本篇文章将会从简单的线性模型开始，了解如何建立一个模型以及建立完模型之后要分析什么东西，然后学习交叉验证的思想和技术，并且会构建一个线下测试集，之后我们会尝试建立更多的模型去解决这个问题，并对比它们的效果，当把模型选择出来之后，我们还得掌握一些调参的技术发挥模型最大的性能，模型选择出来之后，也调完参数，但是模型真的就没有问题了吗？我们还需要绘制学习率曲线看模型是否存在过拟合或者欠拟合的问题并给出相应的解决方法

资源 | Python 环境下的自动化机器学习超参数调优

由于机器学习算法的性能高度依赖于超参数的选择，对机器学习超参数进行调优是一项繁琐但至关重要的任务。手动调优占用了机器学习算法流程中一些关键步骤（如特征工程和结果解释）的时间。网格搜索和随机搜索则不会干涉这些步骤，但是需要大量的运行时间，因为它们浪费了时间去评估搜索空间中并不太可能找到最优点的区域。如今越来越多的超参数调优过程都是通过自动化的方法完成的，它们旨在使用带有策略的启发式搜索（informed search）在更短的时间内找到最优超参数，除了初始设置之外，并不需要额外的手动操作。

pyqlib平台：微软开发的量化投资平台《介绍篇》

TOC 介绍官网：https://github.com/microsoft/qlib 是面向AI的金融量化平台、实现其潜在的价值，创造AI在量化投资的价值。包括全部的机器学习中的数据处理、模型训练、回测；以及量化投资的Alpha 预测、风险模型、市场动态性建模、操作顺序等。使用Qlib可以快速的实现想法到量化投资的策略。 [687474703a2f2f66696e746563682e6d7372612e636e2f696d616765735f763036302f6672616d65776f726b2e70

一文详尽解释CatBoost

CatBoost是俄罗斯的搜索巨头Y andex在2017年开源的机器学习库，也是Boosting族算法的一种，同前面介绍过的XGBoost和LightGBM类似，依然是在GBDT算法框架下的一种改进实现，是一种基于对称决策树（oblivious trees）算法的参数少、支持类别型变量和高准确性的GBDT框架，主要说解决的痛点是高效合理地处理类别型特征，这个从它的名字就可以看得出来，CatBoost是由catgorical和boost组成，另外是处理梯度偏差（Gradient bias）以及预测偏移（Prediction shift）问题，提高算法的准确性和泛化能力。

LightGBM源码阅读+理论分析（处理特征类别，缺省值的实现细节）[通俗易懂]

关于LightGBM，网上已经介绍的很多了，笔者也零零散散的看了一些，有些写的真的很好，但是最终总觉的还是不够清晰，一些细节还是懵懵懂懂，大多数只是将原论文翻译了一下，可是某些技术具体是怎么做的呢？即落实到代码是怎么做的呢？网上资料基本没有，所以总有一种似懂非懂的感觉，貌似懂了LightGBM，但是又很陌生，很不踏实，所以本篇的最大区别或者优势是：源码分析，看看其到底怎么实现的，同时会将源码中的参数和官网给的API结合，这样对一些超参数理解会更透彻（对于一些诸如学习率的参数都是以前GBDT同用的，很熟悉了这里就没源码介绍，感兴趣的自行看源码），下面理解仅代表个人观点，若有错还请大家指教，一起学习交流，同时这里最大的贡献就是对源码的大体框架进行了一个摸索，对其中很多细节也欢迎大家交流学习！！！！最后希望本篇能够给大家在认识LightGBM方面带来那么一点点帮助！！！共勉！！！

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐