首页
学习
活动
专区
工具
TVP
发布

机器学习

算法
专栏成员
31
文章
3974
阅读量
16
订阅数
算法金 | 最难的来了:超参数网格搜索、贝叶斯优化、遗传算法、模型特异化、Hyperopt、Optuna、多目标优化、异步并行优化
机器学习模型中的参数通常分为两类:模型参数和超参数。模型参数是模型通过训练数据自动学习得来的,而超参数则是在训练过程开始前需要人为设置的参数。理解这两者的区别是进行有效模型调优的基础。
算法金
2024-07-09
2590
算法金 | 时间序列预测真的需要深度学习模型吗?是的,我需要。不,你不需要?
时间序列预测,这玩意儿在数据分析界可是个香饽饽,尤其在电力、交通、空气质量这些领域里,预测得准,资源分配更合理,还能让相关部门提前做好准备。但深度学习这小子横空出世,开始抢传统统计学方法的风头。那么问题来了,时间序列预测非得用深度学习吗?咱们今天就来掰扯掰扯。
算法金
2024-07-08
250
算法金 | 推导式、生成器、向量化、map、filter、reduce、itertools,再见 for 循环
For 循环,老铁们在编程中经常用到的一个基本结构,特别是在处理列表、字典这类数据结构时。但是,这东西真的是个双刃剑。虽然看起来挺直白,一用就上手,但是,有时候用多了,问题也跟着来了。
算法金
2024-07-07
890
算法金 | 一个强大的算法模型,GPR !!
高斯过程回归(GPR)是一种非参数化的贝叶斯方法,用于解决回归问题。与传统的线性回归模型不同,GPR 能够通过指定的核函数捕捉复杂的非线性关系,并提供不确定性的估计。在本文中,我们将详细介绍 GPR 算法的定义、核心思想和数学基础,并通过实例展示其在实际应用中的效果。
算法金
2024-07-06
1030
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
平均数,江湖人称“均值”,是一帮数字里的“老大”,它把一伙数字的总和给分了,分给每个数字一样多。就像是帮派里的老大,把抢来的金银财宝平均分给手下的兄弟们。
算法金
2024-07-05
810
算法金 | 我最常用的两个数据可视化软件,强烈推荐
在我行走江湖的行囊中,有两件利器,tableau与matplotlib,它们足以让我应对各种数据可视化的较量。tableau,乃是BI领域的名门正派,其可视化之术,与PowerBI不相上下。matplotlib,则是Python江湖中的一位侠客,以编程之力,绘制图表,既精妙又实用。
算法金
2024-07-04
910
算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice
欧氏距离是两个点在 n 维空间中直线距离的度量。它是最常见的距离度量方法之一,用于计算两个向量之间的距离。欧氏距离的公式如下:
算法金
2024-07-02
2940
算法金 | 线性回归:不能忽视的五个问题
线性回归是一种统计方法,用于研究因变量 𝑌 和一个或多个自变量 𝑋 之间的线性关系。其理论依据主要基于以下几个方面:
算法金
2024-06-30
350
算法金 | 协方差、方差、标准差、协方差矩阵
方差是统计学中用来度量一组数据分散程度的重要指标。它反映了数据点与其均值之间的偏离程度。在数据分析和机器学习中,方差常用于描述数据集的变异情况
算法金
2024-06-29
810
超强,必会的机器学习评估指标
构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。 选择正确的验证指标就像选择一副水晶球:它使我们能够以清晰的视野看到模型的性能。 在本指南中,我们将探讨分类和回归的基本指标和有效评估模型的知识。 学习何时使用每个指标、优点和缺点以及如何在 Python 中实现它们。
算法金
2024-06-28
660
资深博导:我以为数据预处理是常识,直到遇到自己的学生
本文将基于 NIR soil 近红外光谱数据,运用 Python 语言进行数据处理,并通过图表直观反映预处理带来的变化。(数据集:后台回复 [ NIR soil ] 获取 )
算法金
2024-06-26
790
算法金 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost 算法大全
决策树是一种简单直观的机器学习算法,它广泛应用于分类和回归问题中。它的核心思想是将复杂的决策过程分解成一系列简单的决策,通过不断地将数据集分割成更小的子集来进行预测。本文将带你详细了解决策树系列算法的定义、原理、构建方法、剪枝与优化技术,以及它的优缺点。
算法金
2024-06-25
3180
算法金 | 使用随机森林获取特征重要性
大侠幸会幸会,我是日更万日 算法金;0 基础跨行转算法,国内外多个算法比赛 Top;放弃 BAT Offer,成功上岸 AI 研究院 Leader;
算法金
2024-06-24
960
算法金 | K-均值、层次、DBSCAN聚类方法解析
聚类分析(Clustering Analysis)是一种将数据对象分成多个簇(Cluster)的技术,使得同一簇内的对象具有较高的相似性,而不同簇之间的对象具有较大的差异性。这种方法在无监督学习(Unsupervised Learning)中广泛应用,常用于数据预处理、模式识别、图像处理和市场分析等领域
算法金
2024-06-23
4370
算法金 | 统计学的回归和机器学习中的回归有什么差别?
这两者的差别主要体现在模型的目标、假设、复杂性、数据量和评估方法上,各有其应用场景和优势。
算法金
2024-06-22
660
算法金 | 奇奇怪怪的正则化
在机器学习中,过拟合是一个常见的问题,即模型在训练数据上表现很好,但在新数据上表现不佳。为了解决这个问题,正则化技术应运而生。
算法金
2024-06-21
520
审稿人:拜托,请把模型时间序列去趋势!!
时间序列分析是数据科学中一个重要的领域。通过对时间序列数据的分析,我们可以从数据中发现规律、预测未来趋势以及做出决策。无论是股票市场的走势,还是气象数据的变化,都涉及到时间序列分析
算法金
2024-06-20
1910
算法金 | 再见!!!梯度下降(多图)
今天把达叔 6 脉神剑给佩奇了,上 吴恩达:机器学习的六个核心算法! ——梯度下降
算法金
2024-06-19
700
算法金 | 一个强大的算法模型:t-SNE !!
t-SNE(t-Distributed Stochastic Neighbor Embedding)是一种用于降维和数据可视化的非线性算法。它被广泛应用于图像处理、文本挖掘和生物信息学等领域,特别擅长处理高维数据。
算法金
2024-06-18
910
李沐:用随机梯度下降来优化人生!
今天我们来聊聊达叔 6 大核心算法之 —— 优化 算法。吴恩达:机器学习的六个核心算法!
算法金
2024-06-17
1270
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档