专栏首页机器之心周志华西瓜书详细公式推导,Datawhale开源pumpkin-book项目

周志华西瓜书详细公式推导,Datawhale开源pumpkin-book项目

机器之心转载

来源:Datawhale

如果让你推荐两本国内机器学习的入门经典作,你会推荐哪些呢?相信大家同我一样,非李航的《统计学习方法》和周志华的《机器学习》莫属。

如此经典的教材,相信大家买来也绝对不会让他待在书桌的角落。有人说西瓜书要读三遍,先通读建骨骼,再读提筋节,最后读通经络。那小伙伴在学习西瓜书的过程中,遇到最大的问题是什么呢?

公式推导!

读这本书时,你有没有那么一瞬间,有这种感觉,刚刚老师还在讲1+1,低头抬头间,变成了酱紫:

那今天我们项目的主角《pumpkin-book》,提出这个项目的小哥哥有个理念,让天下没有难推的公式(牛逼坏了,叉会儿腰)。

言归正传,南瓜书来源于西瓜书,由 开源组织Datawhale 发起,团队成员谢文睿牵头,带领6位成员,历时1个月,将西瓜书中1-7章节的公式进行了整理,对西瓜书中难点公式进行了详解,有跳跃性的公式进行了补充,于是有了《pumpkin-book》南瓜书项目。

现在我们来具体看下这个项目吧。

关于本书

周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节,诚挚欢迎每一位西瓜书读者前来参与完善本书:一个人可以走的很快,但是一群人却可以走的更远。

使用说明

南瓜书是西瓜书的公式推导版,里面的内容都是以西瓜书的内容为前置知识进行表述,所以 南瓜书的最佳使用方法 是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书。若南瓜书里没有你想要查阅的公式,可以在issues区提交你希望补充推导或者解析的公式编号,我们看到后会尽快进行补充。

内容

目前对1-7章内容进行了梳理,后续内容更新完善中,如果你喜欢推公式,对之后的章节感兴趣,可以加入我们,一起协作完成。

例如在第6章支持向量机中,我们为了求支持向量机的原始最优化问题,需要应用拉格朗日对偶性,并通过解对偶问题而得到原始问题的最优解。在西瓜书中画风是这样的:

其中从6.8到6.9和6.10并没有展示详细的过程。可能有的读者就会迷惑,或者需要手动推一遍。但是借助南瓜书,我们可以快速理解推导的过程:

如果你在学习西瓜书过程中,遇到了不理解的公式,可以在issues留言哦,我们会根据大家需求,更新项目内容。

征集issues区

看到最后,附上《pumpkin-book》GitHub项目链接:

https://github.com/datawhalechina/pumpkin-book

在线阅读地址:

https://datawhalechina.github.io/pumpkin-book/

贡献人员名单:谢文睿、龙俊豪、排骨、孙超、黑桃、叶梁、李振强、居凤霞、胡骞、杨冰楠

Datawhale是一个专注于AI领域的开源组织,被评为上海交通大学国家级孵化项目,目前有7个独立团队,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。目前团队成员50人左右,已组织多个AI领域的开源项目和学习活动。

文字/curry

排版/leaf

本文分享自微信公众号 - 机器之心(almosthuman2014)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-04-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 顶会论文应不应该提交代码?应该,但不能强制

    近日微软研究的 John Langford 讨论了顶会到底应不应该提交代码,因为不同研究主题与领域对代码的需求不同,他表明代码提交应该鼓励,但并不能强制。作为 ...

    机器之心
  • 专栏 | 用神经网络来判定量子纠缠?这里有一篇简单易懂的方法解读

    纠缠态 (entangledstate) 是量子力学预言的一种叠加态,最早是为了批判量子力学所蕴含的哲学思想,而由爱因斯坦等三名科学家于 1935 年首先提出的...

    机器之心
  • 资源 | 清华大学开源神经机器翻译工具包THUMT

    选自arXiv 参与:李泽南 机器翻译是自然语言处理的重要组成部分,其目的是使用计算机自动将文本翻译成其他语言的形式。近年来,端到端的神经机器翻译发展迅速,已经...

    机器之心
  • 我在爱奇艺实习的八个月

    记得去年暑假伊始,在那个炎热的午后,我带着懵懂来到上海面试,如今掐指一算,我已经在公司工作了八个多月。在这段时间里,我在工作上认识了很多前辈,生活中也结交了不少...

    好好学java
  • 疯狂暴涨曾破 2 万美元的比特币,到底是怎么一回事?

    2017 年对比特币来说,是极为疯狂的一年。年初,一枚比特币的价格不到 1,000 美元。在 11 月价格持续突破 8,000、9,000 和 10,000 美...

    企鹅号小编
  • 比特币入门教程

    比特币(bitcoin)诞生于2008年的一篇论文。 一个署名为中本聪的人,提出了革命性的构想:让我们创造一种不受政府或其他任何人控制的货币!这个想法堪称疯狂:...

    ruanyf
  • 利用ScriptEngineManager实现字符串公式灵活计算

    我们知道js的eval()方法可以执行字符串的代码 而恰好jdk6增加了对脚本语言的支持 我们可以利用这个特性对计算实现简单化的处理 

    动力节点Java学院
  • 安卓开发:玩转图片社交系统-仿探探卡片式滑动效果

    第一次进入探探软件界面,就被这种通过卡片式滑动来选择“喜欢/不喜欢”的设计所吸引了。当时就非常想通过自己来实现这种仿探探式的效果,然而却没什么思路。不过毋庸置疑...

    布谷鸟网络科技
  • 天下武功唯快不破:从敏捷数据到敏捷数据分析

    敏捷,指反应(多指动作或言行)迅速快捷。敏捷和技术结合往往具有快速、简单、迭代的特点。如大家听说的敏捷开发就是指:以用户的需求进化为核心,采用迭代、循序渐进的方...

    小莹莹
  • 统治 VR 界,英特尔绝不只是说说而已

    大数据文摘

扫码关注云+社区

领取腾讯云代金券