首页
学习
活动
专区
工具
TVP
发布

算法channel

专栏作者
857
文章
1030551
阅读量
136
订阅数
机器学习常用算法:随机森林分类
机器学习模型通常分为有监督和无监督学习算法。当我们定义(标记)参数时创建监督模型,包括相关的和独立的。相反,当我们没有定义(未标记)参数时,使用无监督方法。在本文中,我们将关注一个特定的监督模型,称为随机森林,并将演示泰坦尼克号幸存者数据的基本用例。 在深入了解随机森林模型的细节之前,重要的是定义决策树、集成模型、Bootstrapping,这些对于理解随机森林模型至关重要。 决策树用于回归和分类问题。它们在视觉上像树一样流动,因此得名,在分类情况下,它们从树的根开始,然后根据变量结果进行二元拆分,直到到达
double
2022-09-01
8230
这725个机器学习术语表,太全了!
你好,我是zhenguo 这是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏! 英文术语 中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Sampling Method 接受-拒绝抽样法/接受-拒绝采样法 Accumulated Error Backpropagation 累积误差反向传播 Accuracy 精度 Acquisition Function 采集函数 Action 动作 Activation Function 激活函数 Acti
double
2022-01-26
5330
RNN 图解版
这篇文章,阐述了RNN的方方面面,包括模型结构,优缺点,RNN模型的几种应用,RNN常使用的激活函数,RNN的缺陷,以及GRU,LSTM是如何试图解决这些问题,RNN变体等。
double
2021-05-07
4600
机器学习和深度学习的 5 个关键区别
大多数人没有意识到机器学习是人工智能(AI)的一种,它诞生于20世纪50年代。1959年,亚瑟·塞缪尔(Arthur Samuel)编写了第一个计算机学习程序,在这个程序中,IBM计算机玩跳棋的时间越长,它就越擅长。快进到今天,当人工智能不仅仅是尖端技术,相关工作薪资高,工作令人兴奋。机器学习工程师的需求量很大,无论是数据科学家还是软件工程师都不具备机器学习领域所需的技能。公司需要精通这两个领域的专业人士,但他们既不能胜任数据科学家的工作,也不能胜任软件工程师的工作。这类人群就是机器学习工程师。
double
2021-03-12
7450
所以,机器学习和深度学习的区别是什么?
https://quantdare.com/what-is-the-difference-between-deep-learning-and-machine-learning/
double
2021-03-12
4300
我们必须要相信那些不可能的事情
这篇文章是我姐夫前几天分享给我的,非常精彩,凯文凯利谈到了未来的12个趋势,今天分享给关注我的每一位粉丝。
double
2021-03-12
2930
素人为什么还要学算法?且看这 25 个回答,第 17 个回答一针见血!
近来经常有朋友问,程序员需要学算法吗?为什么需要学算法?不会算法也能找个Java开发岗造软件所以就别浪费时间了。如果真要学,算法感觉很高深,需要数学,可是我数学不好,所以放弃它吗?
double
2020-06-12
1.2K0
3招打破机器学习工程师的边界
对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。
double
2020-03-19
3040
文本数据挖掘(Text Mining)
文本数据挖掘是利用某些方法比如自然语言处理(Natural language processing (NLP))技术把一堆没有结构的数据而处理成有结构的数据的一种人工智能技术,而处理后的这些有结构的数据可以作为机器学习和深度学习模型的输入,也可以直接分析这些数据产生想要的结果。
double
2020-02-21
1K0
集成学习 (Ensemble Learning)
比如,我们熟知的随机森林就是一种集成学习的方法,它结合了多个决策树的预测结果,而每一个决策树又是用随机的不同的数据训练而成。所以,从这种意义上来讲,随机森林的预测表现一般比单个决策树的表现要好。
double
2020-02-21
4450
Python最被低估的库,用好了效率提升10倍!
Python有许多很好的库(libraries),实现这些功能只需要几行代码。今天介绍一个库:collections. 这个模块提供容器相关的更高性能的数据类型,它们提供比通用容器 dict, list, set 和tuple更强大的功能。
double
2019-11-14
3580
机器学习的最直白讲解,就看这篇!
假如你想深入机器学习和它背后的数学,你将会很快意识到一切都可归结为一个优化问题。就连训练神经网络都是一个参数优化的问题。因此要想理解机器学习算法,你需要首先理解数学优化的基本概念,以及它为什么这么有用。
double
2019-10-29
6592
这样一步一步推导支持向量机,谁还看不懂?
相比其他经典机器学习算法,SVM里面有更多的数学推导,用到拉格朗日乘子法,KKT条件,线性和非线性的核函数,这些都对非数学专业的入门者造成一定门槛。
double
2019-10-22
7320
"爱(AI)与你同行系列"(1):从哪三个方面入手做好特征选择工程?
今天我们聊一聊特征工程方面的知识,随着大数据时代的到来,特征工程发挥着越来越重要的作用。当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。简单说,就是发现对因变量y有明显影响作用的特征,通常称自变量x为特征,特征工程的目的是发现重要特征。一般来说,特征工程大体上可以分为三个方面,一是特征构造,二是特征生成,三是特征选择。
double
2019-10-22
3220
从概率统计到深度学习,四大技术路线图谱,都在这里!
自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法。相比图像或语音,文本的变化更加复杂,例如从预处理来看,NLP 就要求我们根据对数据的理解定制一种流程。而且相比图像等更偏向感知的智能,自然语言包含更高一级的智能能力,不论是承载思想、情感还是推理。
double
2019-10-08
8800
单词拼写纠正器,python实现V2.0
这是我在2017年12月份写的一篇原创文章,那是关注的用户数只有不到1000人,所以这篇文章应该很多读者都未看到。在原来基础上,优化代码显示和源代码的1个bug,和完整的源代码,统一整理到github目录中:
double
2019-10-08
8060
自编码器,做主成分提取,了解一下
自编码器是在无监督(训练集未标注)的情况下,能够学习有效表示数据(称为编码)的一种深度人工网络。这些编码一般跟输入数据比起来有更低的维度,这使得自编码器在数据降维方面比较有用。更重要的是,自编码器可以作为强大的特征检测器,它可以在深度网络中用于无监督的预训练。最后,它可以随机产生和训练数据相似的新数据,这叫做生成模型。例如,我们可以训练一个人脸图像上的自编码器,那么它能够产生新的人脸图像。
double
2019-09-25
5010
推荐一个神级工具:能缓解梯度消失问题&提升训练速度
深度神经网络一直以来就有一个特点:随着网络加深,模型会越来越难以训练。所以深度学习有一个非常本质性的问题:为什么随着网络加深,训练会越来越困难?为了解决这个问题,学界业界也一直在尝试各种方法。
double
2019-09-18
8180
五幅图阐述:机器学习的本质是最优化过程
为了将事物和问题转化为最优化问题数学模型我们需要考虑三个要素:因素变量、约束条件和目标函数。我们根据事物和问题先找到影响模型的所有因素变量,然后再根据目的建立一个目标函数用来衡量系统的效果,最后还要找到客观的限制条件并作为模型的约束。
double
2019-09-09
1.1K0
机器学习实践套路总结
这里说说机器学习问题分析的一般性过程,尽管存在各种各样的机器学习问题,但大体上的步骤及最佳实践都有一定的套路。
double
2019-09-05
5850
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档