首页
学习
活动
专区
工具
TVP
发布

红色石头的机器学习之路

专栏作者
237
文章
218408
阅读量
54
订阅数
《algorithm-note》算法笔记中文版正式发布!
无论是做机器学习、深度学习、自然语言处理还是其它领域,算法的重要性不言而喻!吃透算法底层原理、掌握算法数学推导和代码实现,对提高自己的硬核实力来说非常重要!今天给大家推荐一个超赞的开源算法笔记!中文版!而且在 GitHub 上已经收获了近 1k 的赞了!
红色石头
2022-01-20
1640
第02课:深度学习 Python 必备知识点
无论是在机器学习还是深度学习中,Python 已经成为主导性的编程语言。而且,现在许多主流的深度学习框架,例如 PyTorch、TensorFlow 也都是基于 Python。这门课主要是围绕 “理论 + 实战” 同时进行的,所以本文,我将重点介绍深度学习中 Python 的必备知识点。
红色石头
2022-01-20
7270
第01课:深度学习概述
机器学习,顾名思义,是机器从数据中总结经验,找出某种规律构建模型,并用它来解决实际问题。而深度学习,是机器学习的一个重要分支和延伸,是包含多隐层的神经网络结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,从而学习到数据本身最关键的特征。
红色石头
2022-01-20
3890
专栏 | 基于 Jupyter 的特征工程手册:特征选择(三)
数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。
红色石头
2022-01-20
7400
吴恩达《Machine Learning》精炼笔记 3:回归问题和正则化
假设预测的变量y是离散的值,需要使用逻辑回归Logistic Regression,LR的算法,实际上它是一种分类算法
红色石头
2022-01-20
2070
吴恩达《Machine Learning》精炼笔记 5:神经网络
上面的式子中实现了怎么利用反向传播法计算代价函数的导数,在这里介绍怎么将参数从矩阵形式展开成向量形式
红色石头
2022-01-20
1890
吴恩达《Machine Learning》精炼笔记 6:关于机器学习的建议
当学习的算法时候,考虑的是如何选择参数来使得训练误差最小化。在模型建立的过程中很容易遇到过拟合的问题,那么如何评估模型是否过拟合呢?
红色石头
2022-01-20
1960
吴恩达《Machine Learning》精炼笔记 8:聚类 KMeans 及其 Python实现
比如下面的数据中,横纵轴都是xx,没有标签(输出yy)。在非监督学习中,我们需要将一系列无标签的训练数据,输入到一个算法中,快速这个数据的中找到其内在数据结构。
红色石头
2022-01-20
5510
吴恩达《Machine Learning》精炼笔记 9:PCA 及其 Python 实现
在PCA中,要做的是找到一个方向向量(Vector direction),当把所有的数据都投射到该向量上时,PCA的关键点就是找到一个投影平面使得投影误差最小化。
红色石头
2022-01-20
3190
吴恩达《Machine Learning》精炼笔记 10:异常检测
在商业中也有许多应用,如网络入侵检测(识别可能发出黑客攻击的网络流量中的特殊模式)、系统健康性监测、信用卡交易欺诈检测、设备故障检测、风险识别等
红色石头
2022-01-20
2160
吴恩达《Machine Learning》精炼笔记 11:推荐系统
推荐系统应用的十分广泛:如果你考虑网站像亚马逊,或网飞公司或易趣,或iTunes Genius,有很多的网站或系统试图推荐新产品给用户。如,亚马逊推荐新书给你,网飞公司试图推荐新电影给你,等等。
红色石头
2022-01-20
3380
吴恩达《Machine Learning》精炼笔记 2:梯度下降与正规方程
还是利用房价模型的例子,增加了更多的特征,比如:房间楼层、房间数量、地理位置等,构成了一个含有多个变量的模型
红色石头
2022-01-20
2360
吴恩达《Machine Learning》精炼笔记 1:监督学习与非监督学习
吴恩达(Andrew Ng),毫无疑问,是全球人工智能(AI)领域的大 IP!然而,吴恩达从最早的 CS229,到后来的 deeplearning.ai 深度学习专项课程,还有其它 AI 资源,大神发布的 AI 知名课程和资料非常多。
红色石头
2022-01-20
6400
专栏 | 基于 Jupyter 的特征工程手册:特征选择(四)
数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。
红色石头
2022-01-16
5520
专栏 | 基于 Jupyter 的特征工程手册:特征选择(二)
数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。
红色石头
2022-01-14
4730
专栏 | 基于 Jupyter 的特征工程手册:特征选择(一)
数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。
红色石头
2022-01-14
3500
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(三)
https://github.com/YC-Coder-Chen/feature-engineering-handbook
红色石头
2022-01-14
3140
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)
https://github.com/YC-Coder-Chen/feature-engineering-handbook
红色石头
2022-01-14
9680
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)
特征工程在机器学习中的重要性不言而喻,恰当的特征工程能显著提升机器学习模型性能。我们在 Github 上整理编写了一份系统的特征工程教程,供大家参考学习。
红色石头
2022-01-14
8280
吴恩达《Machine Learning》Jupyter Notebook 版笔记发布!图解、公式、习题都有了
在我很早之前写过的文章《机器学习如何入门》中,就首推过吴恩达在 Coursera 上开设的《Machine Learning》课程。这门课最大的特点就是基本没有复杂的数学理论和公式推导,非常适合入门!
红色石头
2022-01-12
2.1K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档