应兆康的专栏

162 篇文章
60 人订阅

全部文章

YingJoy_

机器学习需要的数学基础

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或...

4979
YingJoy_

10. 用开发集和评估指标来加速迭代

对于一个新问题,事先是很难知道用什么方法解决它是最合适的。即使机器学习经验丰富的研究员也需要尝试许多,才能得到令自己满意的东西。在构建机器学习系统时,我经常会:

3198
YingJoy_

9. 优化指标和满足指标

这里有组合多个评价指标的另一个方法。 假设你同时关系算法的精度和运行时间。你需要在如下分类器中进行选择:

37912
YingJoy_

Andrew Ng - 《Machine Learning Yearning》 Chapter 15-19

Machine Learning Yearning. 全新版本 本书作者是Andrew NG

3747
YingJoy_

8. 建立一个单一数字的评估指标

分类准确率是单一数字评估指标(single-number evaluation metric)的示例:你在你的开发集(或测试集)上运行你的分类器,然后得到样本分...

30910
YingJoy_

7. 开发集和测试集应该多大?

开发集应该足够大,大到可以检测出不同算法之间的差异。比如:如果分类器A的精度为90.0%,分类器B精度为90.1%。如果你的开发集只有100条,那么你可能检测不...

3517
YingJoy_

6. 开发集和测试集应该来自同一分布

根据市场情况,由于存在不同地区的用户,你可以把你的猫咪APP图片数据分为四个区域: (1) 美国 (2) 中国 (3) 印度 (4) 其它地区 为了生成一个开发...

35611
YingJoy_

5. 开发集和测试集

让我们回到之前关于猫咪图片的例子: 你开发了一个移动APP, 用户可以上传许多不同的图片到你的APP上,你想识别出用户上传的图片中所有包含猫咪的图片。 你的团队...

3116
YingJoy_

4. 数据规模的增大促进了机器学习的发展

深度学习(神经网络)中许多的想法都已经存在了几十年。为什么今天这些想法火起来了呢? 促进机器学习发展的因素主要有两个: • 数据量越来越多. 如今人们在数字设备...

3696
YingJoy_

3. 预备知识和符号约定

如果你已经学习了机器学习课程(如我在Coursera上的Machine Learning MOOC),或者你拥有应用监督式学习的经验,你应该可以理解下面的内容。...

3088
YingJoy_

2. 如何使用本书来帮助你的团队

在读完本书后,你将会对如何制定机器学习项目中的技术方案有一个深刻的理解。 但是你的队友可能不会理解为什么使用你制定的技术方案,也许你想和你的团队定义一个评估指标...

3759
YingJoy_

1. 为什么使用机器学习

机器学习是很多应用程序的基础,包括Web搜索、垃圾邮件过滤系统、语音识别、产品推荐等等。如果你的团队正在研究一个机器学习的程序,希望本书可以帮助你快速的取得进展...

2926
YingJoy_

Python实现栈

#!usr/bin/env python #-*- coding:utf-8 -*- """ @author:yzk13 @time: 2018/...

3999
YingJoy_

Python 实现双向链表

#!usr/bin/env python #-*- coding:utf-8 -*- """ @author:yzk13 @time: 2018/0...

3586
YingJoy_

Python 实现单向循环链表

循环链表的概念 1.什么是循环链表   所谓的循环链表就是让单向链表的首尾相连,组成一个环状。 2.循环链表的典型应用   约瑟夫环问题。 3.实现循环链表的重...

4016
YingJoy_

Andrew Ng - 《Machine Learning Yearning》 Chapter 1-14

Machine Learning Yearning. 全新版本 本书作者是Andrew NG

1K24
YingJoy_

强大的位运算

什么是位运算? 程序中的所有数在计算机内存中都是以二进制的形式储存的。位运算说穿了,就是直接对整数在内存中的二进制位进行操作。比如,and运算本来是一个逻辑运算...

3226
YingJoy_

Python 实现单向链表

单向链表 #!usr/bin/env python # -*- coding:utf-8 -*- """ @author:yzk13 @time: 2...

4707
YingJoy_

Pandas Learning

Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳...

7668
YingJoy_

每天一个Linux命令(3)——pwd

pwd命令以绝对路径的方式显示用户当前工作目录。命令将当前目录的全路径名称(从根目录)写入标准输出。全目录使用/分割。第一个/表示根目录,最后一个目录是当前目录...

3036

扫码关注云+社区

领取腾讯云代金券