应兆康的专栏

162 篇文章
60 人订阅

全部文章

YingJoy_

使用Python进行天气预测之获取数据

所以我们加上了判断语句,当然细心的小伙伴应该可以看到我们这里还会构造出2019年的链接,这个错误链接我们在后面获取数据的时候会进行处理,若链接是没用的,我们选择...

8784
YingJoy_

Python实现栈

3727
YingJoy_

为什么使用机器学习

37210
YingJoy_

Andrew Ng - 《Machine Learning Yearning》 Chapter 23-27

Machine Learning Yearning. 全新版本 本书作者是Andrew NG

70426
YingJoy_

Machine-Learning-Yearning Part3 中文版

将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning

4098
YingJoy_

22. 对比最优误差率

在我们的猫咪识别实例中,这个“想法”的错误率指的是——最优分类器的错误率接近0%,就像一个人可以很轻松的识别它。而且随时可以进行识别,我们希望机器也可以做到这点...

30810
YingJoy_

21. 关于偏差和方差的实例

思考我们的猫咪分类器。一个理想的分类器(如:人为分类)会在这个任务中有着完美的表现。

34210
YingJoy_

20. 偏差和方差

假设你的训练集,开发集和测试集都来自同一分布。那么你会觉得获取更多的训练数据就可以提高性能,对吗? 尽管更多的数据是无害的,但它并不是总会像我们所期望的那样有用...

3499
YingJoy_

Andrew Ng - 《Machine Learning Yearning》 Chapter 20-22

Machine Learning Yearning. 全新版本 本书作者是Andrew NG

47114
YingJoy_

Machine-Learning-Yearning Part2 中文版

将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning

3478
YingJoy_

19. 总结:基本错误分析

• 不要一开始就尝试设计和构建完美的系统,而是尽可能快的建立和训练一个基础的系统(几天之内),然后使用错误分析。帮助你找到最优的方向,并迭代改进你的算法。

3269
YingJoy_

18. Eyeball和Blackbox开发集应该多大?

你的 Eyeball 开发集应该足够大,大到可以让你了解到算法的主要错误类别。如果你正在从事一项人类可以表现很好的任务(如识别图像中的猫咪),下面是一些指导方...

3268
YingJoy_

17. 如果你有一个很大的开发集,把它分为两个子集,只着眼于其中一个

假设你有一个含有5000个样本的大型开发集,其中有20%的错误率。这样,算法对约1000个图片进行错误分类。手动检查1000张图片是非常耗费时间的, 所以我们可...

32010
YingJoy_

16. 清理贴错标签的开发集和测试集样本

在错误分析期间,你可能会注意到开发集中的一些样本被错误标记(mislabeled)。当我说”dislabeled”时,我的意思是在模型训练之前,这个样本被错误的...

34410
YingJoy_

15. 在错误分析中并行多个想法

你的团队有以下几个想法,来改进你的猫咪分类器: • 解决狗被错误分为猫咪的问题。 • 解决“大型猫科动物(greast cats)”(狮子或豹子等)被错认家猫(...

3819
YingJoy_

Machine-Learning-Yearning Part1 中文版

将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning

5098
YingJoy_

14. 错误分析:查看开发集样本来评估ideas

当你使用猫咪APP的时候,注意到一些被错误,识别成猫咪的狗样本。一些狗长的像猫! 于是一个团队成员建议和第三方软件进行合作,使系统可以更好的处理狗样本。这些改...

3758
YingJoy_

13. 快速构建你的第一个系统,然后进行迭代

你想建立一个新的反垃圾邮件系统,你的团队有以下想法: • 收集一个含有大量垃圾邮件的训练集。例如,设置一个“蜜罐”:故意发送虚假的电子邮件给已知垃圾邮件发送者,...

34110
YingJoy_

12. 小结:建立开发集和测试集

• 从分布中选择开发集和测试集 ,它需要反映你将来的数据情况,并且它的效果足够好,这可能与训练的数据不在同一分布。

30910
YingJoy_

11. 什么时候更改开发/测试集和评估指标

当开始一个新项目的时候,我会试图快速的选择开发/测试集,因为这样可以给团队一个很明确的目标。 我通常会要求我的团队在不到一周的时间内(几乎不会超过这个时间)提供...

3677

扫码关注云+社区

领取腾讯云代金券