首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
872102
阅读量
105
订阅数
机器学习最优化算法(全面总结)
对于几乎所有机器学习算法,无论是有监督学习、无监督学习,还是强化学习,最后一般都归结为求解最优化问题。因此,最优化方法在机器学习算法的推导与实现中占据中心地位。在这篇文章中,小编将对机器学习中所使用的优化算法做一个全面的总结,并理清它们直接的脉络关系,帮你从全局的高度来理解这一部分知识。
Python数据科学
2023-08-29
3080
图解 72 个机器学习基础知识点
人工智能(Artificial intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念,人工智能的最终目标是使计算机能够模拟人的思维方式和行为。
Python数据科学
2023-08-29
2490
Scikit-Learn 和大模型 LLM 强强联手!
我们以前介绍Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。比如pandas-ai的出现:
Python数据科学
2023-08-29
2430
用scikit-plot可视化训练好的模型
scikit-learn (sklearn)是Python环境下常见的机器学习库,包含了常见的分类、回归和聚类算法。在训练模型之后,常见的操作是对模型进行可视化,则需要使用Matplotlib进行展示。
Python数据科学
2023-08-29
1810
安利 4 个时序预测算法:Prophet、Deep AR..
时间序列预测是一个发展历史悠久的技术领域,传统的统计学算法(e.g. ARIMA、ETS、GARC)以及近年来的机器学习(e.g. 广义线性模型、xgboost)、深度学习算法(e.g. LSTM、CNN、Transformer) 都可以用于时间序列预测,不同方法各有长处和短处。
Python数据科学
2022-04-12
2.7K1
概率论回顾.pptx
机器学习,需要一定的数学基础,需要掌握的数学基础知识特别多,如果从头到尾开始学,估计大部分人来不及,我建议先学习最基础的数学知识。
Python数据科学
2021-12-27
3760
这 725 个机器学习术语表,太全了!
大家好,我是东哥。 下面是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏! 英文术语 中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Sampling Method 接受-拒绝抽样法/接受-拒绝采样法 Accumulated Error Backpropagation 累积误差反向传播 Accuracy 精度 Acquisition Function 采集函数 Action 动作 Activation Function 激活函数 Active
Python数据科学
2021-10-21
5730
CNN网络结构的发展(最全整理)
在图像中局部像素之间的联系较为紧密,而距离较远的像素联系相对较弱。因此,其实每个神经元没必要对图像全局进行感知,只需要感知局部信息,然后在更高层局部信息综合起来即可得到全局信息。卷积操作即是局部感受野的实现,并且卷积操作因为能够权值共享,所以也减少了参数量。
Python数据科学
2021-10-19
1.6K0
如何检测两组数据是否同分布?
一个模型中,很重要的技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设,但很多时候我们默认这个道理,却很难有方法来保证数据同分布。
Python数据科学
2021-10-08
2.2K0
Logistic Regression:最基础的神经网络
从基本的概念、原理、公式,到用生动形象的例子去理解,到动手做实验去感知,到著名案例的学习,到用所学来实现自己的小而有趣的想法......我相信,一路看下来,我们可以感受到深度学习的无穷的乐趣,并有兴趣和激情继续钻研学习。
Python数据科学
2021-09-08
5910
机器学习:超参自动优化方法总结
本文旨在介绍当前被大家广为所知的超参自动优化方法,像网格搜索、随机搜索、贝叶斯优化和Hyperband,并附有相关的样例代码供大家学习。
Python数据科学
2021-09-08
9270
机器学习建模中的 Bagging 思想
我们在生活中做出的许多决定都是基于其他人的意见,而通常情况下由一群人做出的决策比由该群体中的任何一个成员做出的决策会产生更好的结果,这被称为群体的智慧。集成学习(Ensemble Learning)类似于这种思想,集成学习结合了来自多个模型的预测,旨在比集成该学习器的任何成员表现得更好,从而提升预测性能(模型的准确率),预测性能也是许多分类和回归问题的最重要的关注点。
Python数据科学
2021-08-10
7380
贝叶斯学派与频率学派有何不同?
要说贝叶斯和频率学派,那简直太有意思了。为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战。我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习下来,说实话感觉有点懂了,但又感觉没理解透。
Python数据科学
2021-06-10
1.9K0
强悍!TensorFlow 开源 TF-DF 决策森林库
在人工智能发展史上,各类算法可谓层出不穷。近十几年来,深层神经网络的发展在机器学习领域取得了显著进展。通过构建分层或「深层」结构,模型能够在有监督或无监督的环境下从原始数据中学习良好的表征,这被认为是其成功的关键因素。
Python数据科学
2021-06-10
6630
机器学习:模型调参大法总结
调参即超参数优化,是指从超参数空间中选择一组合适的超参数,以权衡好模型的偏差(bias)和方差(variance),从而提高模型效果及性能。常用的调参方法有:
Python数据科学
2021-03-17
6.8K0
从零开始,用Python徒手写线性回归
对于大多数数据科学家而言,线性回归方法是他们进行统计学建模和预测分析任务的起点。这种方法已经存在了 200 多年,并得到了广泛研究,但仍然是一个积极的研究领域。由于良好的可解释性,线性回归在商业数据上的用途十分广泛。当然,在生物数据、工业数据等领域也不乏关于回归分析的应用。
Python数据科学
2021-01-28
7120
太骚了!Python模型完美切换SAS,还能这么玩。。
大家都知道,Python 和 SAS 是两个很常用的数据挖掘工具。Python 开源、免费、有丰富的三方库,一般在互联网公司广泛使用。而SAS需付费,且费用较高,一般互联网公司无法承担,更多的是在银行等传统金融机构中使用,不过这两年由于Python太火,原本使用SAS的也开始逐渐转向Python了。
Python数据科学
2021-01-13
1.3K0
决策树算法的原理(接地气版)
决策树算法不像前面介绍的SVM那样,散发着浓厚的数学气味。这个算法还是比较接地气的。
Python数据科学
2020-08-19
4700
大赞!分享一个数据科学利器 PyCaret,几行代码搞定从数据处理到模型部署
学习数据科学很久了,从数据探索、数据预处理、数据模型搭建和部署这些过程一直有些重复性的工作比较浪费时间,尤其当你有个新的想法想要快速尝试下效果的时候,效率很低。
Python数据科学
2020-06-09
1.6K0
机器学习研究者的养成指南,吴恩达建议这么读论文
近日,一位网友在 Reddit 上发帖提问:「那些高效的机器学习研究者,都有什么样的习惯?」
Python数据科学
2020-02-24
3320
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档