前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >临行在即,分享一个自己写的sklearn源码库

临行在即,分享一个自己写的sklearn源码库

作者头像
luanhz
发布2020-05-20 00:02:58
3670
发布2020-05-20 00:02:58
举报
文章被收录于专栏:小数志小数志

导读

考虑接下来一段时间会出差在外,现将自己近1个月来学习ML算法的一点成果做以分享,相关源码纯干货版本已上传至GitHub,有需要者可通过"阅读原文"连接自行clone。

mySKlearn工程文件结构

GitHub仓库目录

几点说明:

  • 算法进度:当前已完成大部分经典算法,包括:
    • 线性回归模型3个、线性分类(逻辑斯蒂回归)1个
    • 朴素贝叶斯2个,多项式NB和高斯NB
    • 决策树分类和回归各1个
    • K近邻分类和回归各1个
    • Kmeans聚类1个
    • 降维算法1个,PCA
    • 常用预处理模型
    • 常用模型选择函数及网格搜索类
    • 常用评价指标
  • 程序规范:代码基本符合sklearn标准,包括参数命名、接口规范等
  • 代码来源:90%以上源码为个人学习后根据理解编写,极少数有参考sklearn官方源码(如调整兰德指数源码)或他人成果(ID3决策树实现和LinearRegression中梯度下降求解)
  • 算法测试:毫无疑问,当前算法还远远达不到鲁棒性标准,仅添加了部分对数据的断言,遇到不合法输入还可能会出bug或报错
  • 后续:下步将逐步添加SVM以及部分集成学习算法实现,并持续优化已有算法实现

源码断续更新中……

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小数志 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档