首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

好文速递:使用机器学习方法改善卫星对海洋颗粒有机碳浓度的检索

摘要:微粒有机碳(POC)在海洋碳循环中起着至关重要的作用,是将碳移至深海的“生物泵”的一部分。蓝绿带比例算法可用于在全球海洋中推算POC浓度;但是,它往往会低估光学复杂水中的高值。为了开发准确,可靠的海洋POC模型,本研究旨在探索卫星学习POC浓度的机器学习方法。测试了三种机器学习方法,即极端梯度增强(XGBoost),支持向量机(SVM)和人工神经网络(ANN),并采用了递归特征消除(RFE)方法来识别敏感特征。全球原位POC测量与海洋颜色气候变化倡议(OC-CCI)产品的配对用于训练和评估POC模型。结果表明,机器学习方法产生的性能明显优于蓝绿色带比率算法,并且在测试的三种机器学习方法中,XGBoost最为稳健。但是,蓝绿色带比率算法仍然适用于POC较低的晴朗开放海水,而ANN对于POC极高的光学复杂水域更为有效。这项研究为卫星检索POC浓度提供了全球适用的方法,这将有助于研究全球海洋以及生产性边缘海中POC的动力学。

03

小巧玲珑:机器学习届快刀XGBoost的介绍和使用

该文介绍了如何使用XGBoost算法进行机器学习,包括数据预处理、模型训练、模型评估和模型预测。文章还介绍了XGBoost在TDW平台上的应用,包括基于Tesla平台的XGBoost-on-Spark组件、XGBoost-Spark-X86组件和XGBoost-Yarn组件。这些组件提供了从数据预处理到模型训练、评估和预测的一整套解决方案,大大简化了使用XGBoost进行机器学习的流程。同时,该文还介绍了XGBoost在TDW平台上的应用,包括XGBoost-Spark-PPC组件、XGBoost-Spark-X86组件和XGBoost-Yarn组件,以及它们在TDW平台上的使用方法。通过使用这些组件,用户可以快速、高效地进行机器学习,大大提高了开发效率和模型性能。

03

学界 | 多 GPU 加速学习,这是一份崭新的 XGBoost 库

梯度提升是一种可以获得当前最佳性能的监督学习方法,它在分类、回归和排序方面有很好的表现。XGBoost 是一般化梯度提升算法的实现,它在多核和分布式机器上有着高度优化的实现,且能处理稀疏数据。怀卡托大学和英伟达在这一篇论文中描述了标准 XGBoost 库的扩展,它支持多 GPU 的执行,并能显著地减少大规模任务的运行时间。本论文提出的扩展是原版 GPU 加速算法的新进展,它展现出拥有更快速和更高内存效率的策树算法。该算法基于特征分位数(feature quantiles)和梯度提升树其它部分的并行化算法。作者们在 GPU 上实现决策树构建、分位数生成、预测和梯度计算算法,并端到端地加速梯度提升流程。这一过程使得 XGBoost 库可以利用显著提升的内存带宽和大规模并行化 GPU 系统集群。

03
领券