专栏首页祥子的故事Kaggle课程 | lecture 1 机器学习算法、工具与流程概述

Kaggle课程 | lecture 1 机器学习算法、工具与流程概述

在july的网站购买了kaggle课程,自己学习并作笔记记录,非给july打广告,只是为了不忘记或自己学习查询。

在这里感谢july提供的该课程。

下面开始笔记。

  • 主要内容
  • 应用领域
  • 常用算法
  • 算法之间的联系
  • 工具

常用scikit-learn ,文本分析用gensim,数据处理用Numpy、matplotlib、pandas,深度学习有tensorflow、caffe、keras

  • 解决问题的流程

图中的链接: http://blog.csdn.net/han_xiaoyang/article/details/50469334

http://blog.csdn.net/han_xiaoyang/article/details/52910022

内容很详细,值得一看。

  • 数据预处理

上采样: 下采样: 数据样本均衡: 正例、负例样本量保持均衡,之间数量差别不要太大。

  • 特征工程

这里建议看特征工程三把刀那篇博文: http://www.36dsj.com/archives/69769

  • 特征类型

参考内容: http://scikit-learn.org/stable/modules/preprocessing.html

http://scikit-learn.org/stable/modules/classes.html#module-sklearn.feature_extraction

  • 方法

链接:http://scikit-learn.org/stable/modules/feature_selection.html

  • 交叉验证

链接:http://scikit-learn.org/stable/modules/cross_validation.html

  • 模型参数选择

链接: 交叉验证http://scikit-learn.org/stable/modules/grid_search.html

http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

  • 模型状态评估

用于判断模型是否过拟合还是欠拟合

  • 学习曲线

模型训练后的训练误差和测试误差

  • 模型融合

链接:http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingClassifier.html

  • Boosting

链接:http://scikit-learn.org/stable/modules/classes.html#module-sklearn.ensemble

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • LeetCode | 两数之和除以10

    努力在北京混出人样
  • R语言:计算各种距离

    ================================================================================...

    努力在北京混出人样
  • LeetCode | 两数之和除以10

    如: (2 -> 4 -> 3) (5 -> 6 -> 4) 输出为: 7 -> 0 -> 8

    努力在北京混出人样
  • SpringSecurity认证流程分析

      我们前面实现了使用自定义认证界面的功能,但是后台认证校验还是使用的’/login’来处理的,对比的账号密码还是我们写在内存的数据,那我们如果想要实现和数据库...

    用户4919348
  • go test 下篇

    go test 上篇 给大家介绍了golang自带的测试框架,包括单元测试和性能测试。但是在实际生产中测试经常会遇到一些网络或者依赖的第三方系统接口,运行测试用...

    用户2937493
  • CORS跨域资源共享(二):详解Spring MVC对CORS支持的相关类和API【享学Spring MVC】

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    BAT的乌托邦
  • Spring Security 工作原理概览

    本文由读者 muggle 投稿,muggle 是一位具备极客精神的90后单身老实猿,对 Spring Security 有丰富的使用经验,muggle 个人博客...

    江南一点雨
  • Spring Security 工作原理概览

    SpringSecurity 采用的是责任链的设计模式,它有一条很长的过滤器链。现在对这条过滤器链的各个进行说明:

    南风
  • Spark设计理念和基本架构

    Spark学习技巧
  • Python中的PyDoc介绍

    用户2398817

扫码关注云+社区

领取腾讯云代金券