课程介绍
本课程从机器学习中的数学基础、到基本模型、特征工程、工业实战、高阶知识、深度学习,六大阶段,层层深入、逐层递进,直通机器学习本质与其应用,且解决以下十大问题,微积分与矩阵知识在机器学习中如何应用、逻辑回归如何在海量工业实战数据下应用、如何对商品销量进行高准确率预测、如何使用隐马尔可夫模型(HMM)对中文进行分词、如何使用随机森林和支持向量机(SVM)对数据进行分类、如何使用Tensorflow构建RNN模型进行分类预测、如何使用LDA等对文档进行分类、如何自己构建数据集并使用Caffe进行分类、如何使用xgboost与lightGBM在Kaggle比赛中获胜、如何使用循环神经网络抓取文本特征
课程目录
夯实数学基础
第1课 机器学习中的微积分与矩阵
知识点1:Taylor展式、梯度下降和牛顿法初步
知识点2:特征向量、对称矩阵对角化、线性方程
第2课 概率与凸优化
知识点1:矩估计、极大似然估计
知识点2:凸集、凸函数、凸优化、KKT条件
掌握基本模型 打开ML大门
第3课 回归问题与应用
知识点1:线性回归、logistic回归、梯度下降
实战项目:分布拟合与回归、用LR分类与概率预测
实战项目:实际工程海量数据下的logistic回归使用,包括样本处理、特征处理、算法调优和背后的原理
第4课 决策树、随机森林、GBDT
知识点1:决策树 随机森林、GBDT
实战项目:使用随机森林进行数据分类
第5课 SVM
知识点1:线性可分支持向量机、线性支持向量机、非线性支持向量机、SMO
实战项目:使用SVM进行数据分类
第6课 最大熵与EM算法
知识点1:熵、相对熵、信息增益、最大熵模型、IIS、GMM
重中之重 特征工程
第7课 机器学习中的特征工程处理
知识点1:数据清洗、异常点处理、特征抽取、选择与组合策略
实战项目:特征处理与特征选择工具与模板
第8课 多算法组合与模型最优化
知识点1:机器学习问题场景分析、算法选择、模型构建、模型性能分析与优化策略
实战项目:构建模型组合策略工具与模板
工业实战 在实战中掌握一切
第9课 sklearn与机器学习实战
知识点1:sklearn板块介绍,组装与建模流程搭建
实战项目:经典Titanic案例,商品销量预测案例等
第10课 高级工具xgboost/lightGBM与建模实战
知识点1:xgboost与lightGBM使用方法与高级功能
实战项目:Titanic与商品销量预测进阶,Kaggle案例实战
第11课 用户画像与推荐系统
知识点1:基于内容的推荐,协同过滤,隐语义模型,learning to rank,推荐系统评估
实战项目:实际打分数据上的推荐系统构建
第12课 聚类
知识点1:K-means/K-Medoid/层次聚类
实战项目:K-means代码实现和实际应用分析
第13课 聚类与推荐系统实战
实战项目:用户聚类结合推荐算法,构建推荐系统完整案例(送完整可运行的代码)
高阶知识 深入机器学习
第14课 贝叶斯网络
知识点1:朴素贝叶斯、有向分离、马尔科夫模型
第15课 隐马尔科夫模型HMM
知识点1:概率计算问题、参数学习问题、状态预测问题
实战项目:使用HMM进行中文分词
第16课 主题模型
知识点1:pLSA、共轭先验分布、LDA
实战项目:使用LDA进行文档分类
迈入深度学习 打开DL大门
第17课 神经网络初步
知识点1:全连接神经网络、反向传播算法与权重优化,训练注意点
实战项目:构建神经网络解决非线性切分问题
第18课 卷积神经网络与计算机视觉
知识点1:卷积神经网络结构分析、过拟合与随机失活,卷积神经网络理解
实战项目:工业界常用网络结构与搭建
第19课 循环神经网络与自然语言处理
知识点1:循环神经网络、长时依赖问题与长短时记忆网络,BPTT算法
实战项目:利用循环神经网络生成文本、学汪峰写歌词
第20课 深度学习实践
知识点1:Caffe应用要点、TensorFlow/Keras简介
实战项目:用Caffe在自己的数据集上完成分类,用Tensorflow构建RNN模型分类预测
课程展示
领取专属 10元无门槛券
私享最新 技术干货