专栏首页小数志临行在即,分享一个自己写的sklearn源码库

临行在即,分享一个自己写的sklearn源码库

导读

考虑接下来一段时间会出差在外,现将自己近1个月来学习ML算法的一点成果做以分享,相关源码纯干货版本已上传至GitHub,有需要者可通过"阅读原文"连接自行clone。

mySKlearn工程文件结构

GitHub仓库目录

几点说明:

  • 算法进度:当前已完成大部分经典算法,包括:
    • 线性回归模型3个、线性分类(逻辑斯蒂回归)1个
    • 朴素贝叶斯2个,多项式NB和高斯NB
    • 决策树分类和回归各1个
    • K近邻分类和回归各1个
    • Kmeans聚类1个
    • 降维算法1个,PCA
    • 常用预处理模型
    • 常用模型选择函数及网格搜索类
    • 常用评价指标
  • 程序规范:代码基本符合sklearn标准,包括参数命名、接口规范等
  • 代码来源:90%以上源码为个人学习后根据理解编写,极少数有参考sklearn官方源码(如调整兰德指数源码)或他人成果(ID3决策树实现和LinearRegression中梯度下降求解)
  • 算法测试:毫无疑问,当前算法还远远达不到鲁棒性标准,仅添加了部分对数据的断言,遇到不合法输入还可能会出bug或报错
  • 后续:下步将逐步添加SVM以及部分集成学习算法实现,并持续优化已有算法实现

源码断续更新中……

本文分享自微信公众号 - 小数志(Datazhi),作者:luanhz

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Tableau可视化之多变折线图

    导读:Tableau是商业智能软件届的翘楚,对于制作各种可视化分析图表极为便捷。本文主要讲解用tableau制作各种多变折线图,包括凹凸图、弧线图和雷达图等。

    luanhz
  • python数据科学系列:numpy入门详细教程

    python数据科学基础库主要是三剑客:numpy,pandas以及matplotlib,每个库都集成了大量的方法接口,配合使用功能强大。平时虽然一直在用,也看...

    luanhz
  • 应用scrapy爬虫框架

    scrapy=scrap+python,是python自动化爬虫框架,相当于一个模板。当启动了一个scrapy工程后,会自动生成若干相互关联的文件,用户仅需根据...

    luanhz
  • 浅说深度学习之一-从到

    上一次,司德谭同学给大家介绍了机器学习的基本概念和特征提取的具体例子,相信大家对于机器学习已经有了一个基本的概念。 和君商学院的王明夫院长曾经给我们提出了一个A...

    企鹅号小编
  • 利用express+socket.io实现一个简易版聊天室

    最近由于利用node重构某个项目,项目中有一个实时聊天的功能,于是就研究了一下聊天室,在线demo|源码,欢迎大家反馈。这个聊天室的主要利用到了socket.i...

    前端博客 : alili.tech
  • 人工智能学习路线“六小撇步”

    高等数学是基础中的基础,一切理工科都需要这个打底,数据挖掘、人工智能、模式识别此类跟数据打交道的又尤其需要多元微积分运算基础线性代数很重要,一般来说线性模型是你...

    机器人网
  • 人工智能“六步走”学习路线

    高等数学是基础中的基础,一切理工科都需要这个打底,数据挖掘、人工智能、模式识别此类跟数据打交道的又尤其需要多元微积分运算基础

    机器人网
  • 程序员再也不能埋头敲代码了

    上周,阿里巴巴重磅发布了机器学习平台 PAI 3.0 版本,据悉,这个 PAL 平台封装了 200 多种经典算法,可以轻松搭建机器学习实验。作为码农一枚,使我不...

    AI科技大本营
  • 算法对建筑业的影响,不仅仅是画图

    场景描述:近年来,算法在各行各业发挥作用,它也正在悄然改变建筑业。人工智能算法为设计师们带来了更多可能,为我们带来更多更惊艳、更合理的设计。

    HyperAI超神经
  • 开发机器学习应用程序的步骤

    [美]Peter Harrington. 机器学习实战 (图灵程序设计丛书 72) (Kindle 位置 519-529). 人民邮电出版社. Kindle 版...

    iOSDevLog

扫码关注云+社区

领取腾讯云代金券