前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习-5:DeepLN之CNN权重更新(笔记)

机器学习-5:DeepLN之CNN权重更新(笔记)

作者头像
MachineLP
发布2022-05-09 14:40:46
6210
发布2022-05-09 14:40:46
举报
文章被收录于专栏:小鹏的专栏小鹏的专栏

​你要的答案或许都在这里:小鹏的博客目录

我想说:

学习dl不去深层的扒扒,没有理论的支撑是不行的,今天分享一篇笔记,另加读者的心得,很棒。

读者分享数据挖掘心得:

我跟你讲一下在实际项目中我们是怎么做数据挖掘的。

1:定义业务问题,很多人认为机器学习越高大上的算法越厉害,其实不是这样的,每类算法都有特定的业务场景。机器学习主要分为有监督无监督和半监督,当拿到业务问题时,要看业务场景下哪类算法比较好。比如做风控我们会用决策树,做点击率预估我们会用LR。这里你要清楚每个算法的优缺点,比如为什么我要用决策树不用随机森林,为什么用LR不用SVM

2:根据模型做数据的收集和整合(比如爬虫,建立数据仓库,用户画像,使用spark做数据统计和清洗等等)

3:拿到数据以后,怎么建立有效的特征 因为数据不可能都是完整的,会有缺失值和异常值 这个时候需要根据业务做一些业务场景下的替代,比如用平均值代替缺失值,用中值代替异常值 

4:数据特征的向量化表示 比如LR,LR这个模型要求输入的数据必须是0到1之间的,但是我们的数据不可能都是0到1之间的,这个时候就需要对数据进行向量化表示(比如离散化也叫做one hot encoding,归一化)文本数据使用(tf-idf word2vec)等等 

5:建立有效的损失函数 把数据跑到LR中,需要一种方法来迭代数据的误差,比如Logloss function 我们的目的就是不断迭代求出误差的最小值

6:怎么快速求出模型 这里比如离线数据下我们会使用梯度下降算法迭代模型 实时数据下我们会使用ftrl算法迭代模型

7:模型的评估 比如使用AUC 

8:模型的调整 比如过拟合我们会使用正则项,pca降维 这里比如会用交叉验证算出正则向的系数 其实大部分数据挖掘场景下都是这个套路。

下面是cnn权重更新详解:

还可以参考:

1. 反向传播和它的直观理解:https://cloud.tencent.com/developer/article/1016525

  1. UFLDL教程:http://deeplearning.stanford.edu/wiki/index.php/UFLDL教程

3. http://www.moonshile.com/post/juan-ji-shen-jing-wang-luo-quan-mian-jie-xi#toc_11

推荐阅读:

1. 机器学习-1:MachineLN之三要素

2. 机器学习-2:MachineLN之模型评估

3. 机器学习-3:MachineLN之dl

4. 机器学习-4:DeepLN之CNN解析

5. 机器学习-5:DeepLN之CNN权重更新(笔记)

6. 机器学习-6:DeepLN之CNN源码

7. 机器学习-7:MachineLN之激活函数

8. 机器学习-8:DeepLN之BN

9. 机器学习-9:MachineLN之数据归一化

10. 机器学习-10:MachineLN之样本不均衡

11. 机器学习-11:MachineLN之过拟合

12. 机器学习-12:MachineLN之优化算法

13. 机器学习-13:MachineLN之kNN

14. 机器学习-14:MachineLN之kNN源码

15. 机器学习-15:MachineLN之感知机

16. 机器学习-16:MachineLN之感知机源码

17. 机器学习-17:MachineLN之逻辑回归

18. 机器学习-18:MachineLN之逻辑回归源码

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018-01-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档