首页
学习
活动
专区
工具
TVP
发布

应兆康的专栏

专栏作者
162
文章
298848
阅读量
63
订阅数
【玩转腾讯云】打造你的私人 AI 助手
今天给大家带来的是:在腾讯云上打造你的私人 AI 助手,没想到腾讯云还可以这样玩。
YingJoy_
2020-04-19
11.4K3
开发集和测试集
让我们回到之前关于猫咪图片的例子: 你开发了一个移动APP, 用户可以上传许多不同的图片到你的APP上,你想识别出用户上传的图片中所有包含猫咪的图片。 你的团队下载了很多图片数据集,包含猫咪图片(正
YingJoy_
2018-05-30
5680
10. 用开发集和评估指标来加速迭代
对于一个新问题,事先是很难知道用什么方法解决它是最合适的。即使机器学习经验丰富的研究员也需要尝试许多,才能得到令自己满意的东西。在构建机器学习系统时,我经常会: 首先有一些如何构建系统的想法(idea
YingJoy_
2018-05-30
4530
Andrew Ng - 《Machine Learning Yearning》 Chapter 23-27
Machine Learning Yearning. 全新版本 本书作者是Andrew NG
YingJoy_
2018-05-09
9832
Machine-Learning-Yearning Part3 中文版
将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning
YingJoy_
2018-05-09
7081
21. 关于偏差和方差的实例
思考我们的猫咪分类器。一个理想的分类器(如:人为分类)会在这个任务中有着完美的表现。
YingJoy_
2018-05-09
6031
Andrew Ng - 《Machine Learning Yearning》 Chapter 20-22
Machine Learning Yearning. 全新版本 本书作者是Andrew NG
YingJoy_
2018-05-09
8031
Machine-Learning-Yearning Part2 中文版
将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning
YingJoy_
2018-05-09
6320
Machine-Learning-Yearning Part1 中文版
将同步至Github: https://github.com/yingzk/Machine-Learning-Yearning
YingJoy_
2018-05-09
8621
14. 错误分析:查看开发集样本来评估ideas
当你使用猫咪APP的时候,注意到一些被错误,识别成猫咪的狗样本。一些狗长的像猫! 于是一个团队成员建议和第三方软件进行合作,使系统可以更好的处理狗样本。这些改变需要花一个月的时间,并且团队成员热衷于这一方案,你会让他们这样做吗? 在为这个任务投资一个月前,我建议你首先评估一下它实际上会提高多少系统 的准确率。然后你才能理性的选择是否值得花费这一个月的开发时间。 具体来说,你可以做这些事情: 1. 获取100个系统分类错误的样本 2. 手动查看这些样本,计算其中有多少比例是狗的图片 查看错误分类样例的这一过程称为:错误分析(error analysis)。在该案例中,如果你发现只有5%的错误分类图像是狗,那么无论你在狗的问题上做多少改进,可能你都无法消除这5%的错误。换句话说,这5%是上述建议能够达到的改进上限。因此,整个系统当前的准确率是90%(误差10%),这一改进可能得到最多90.5%的准确率(或9.5%的错误率,比原来的错误率少5%)。 相反,如果你发现50%的错误图像都是狗,那么你最好找一个第三方进行合作。它可以将准确率从90%提升到95%(误差相对减少50%,从10%降到5%)。 这种简单的错误分析的计算过程可以给你一个快速的方法来评估为“狗”的问题加入第三方软件是否值得。它为你决定是否做出这笔投资提供了一个定量的基准。 错误分析通常可以帮你找出不同想法有哪些前景。我看到很多工程师不愿意进行错误分析。相比于质疑这个想法是否值得花时间投入,直接实现一个然后查看效果可能会更好,这是一个常见的错误:可能会导致你的团队花费一个月的时间只能带来很少的收益。 手动检查100个样本不会花费太长的时间。即使你每分钟只看一张图,不到两小时你就可以完成,这不到两小时的时间可以为你节约一个月的白白努力时间,值得花费。 错误分析(error analysis)是指检测开发集中算法错误分类样本的过程,以便了解错误的深层原因。它不仅可以帮你重点发展你的项目,正如这个例子所述,还可以给你一些新的启发。下节将讨论该内容。接下来几个章节还将介绍一些错误分析的最佳实践。
YingJoy_
2018-05-09
9331
13. 快速构建你的第一个系统,然后进行迭代
你想建立一个新的反垃圾邮件系统,你的团队有以下想法: • 收集一个含有大量垃圾邮件的训练集。例如,设置一个“蜜罐”:故意发送虚假的电子邮件给已知垃圾邮件发送者,以便于能够自动收集它们发送到这些地址的垃圾邮件。 • 开发用于理解电子邮件文本内容的功能。 • 开发用于理解电子邮件header(不清楚可以参考:https://whatismyipaddress.com/email-header)特性的功能,以显示消息所经历的一组网络服务器。 • and more. 尽管我在反垃圾邮件上已经做了大量工作,但我还是很难选择其中的一个方向,如果你不是应用领域的专家,那将更难。 所以,开始的时候不要试图设计和构建完美的系统。相反,应该快速构建和训练出一个基本系统——在短短几天的实际内5即使基本系统与你“最佳”系统相差很多,研究基本系统的功能仍非常具有价值:你可以很快的找到你最希望的方向的线索。接下来几章将告诉你如何去阅读这些线索。
YingJoy_
2018-05-09
5910
10. 用开发集和评估指标来加速迭代
对于一个新问题,事先是很难知道用什么方法解决它是最合适的。即使机器学习经验丰富的研究员也需要尝试许多,才能得到令自己满意的东西。在构建机器学习系统时,我经常会:
YingJoy_
2018-05-09
6651
课程预告
个人整理的部分人工智能课程    有不足的地方求谅解 网站初建,很多地方不完善,后续会逐渐完善,感谢每一个访问此页面的人。
YingJoy_
2018-03-21
7290
Python 机器学习库 --- sklearn --- 线性模型
本文介绍了Python机器学习库sklearn中的线性回归模型,包括普通最小二乘法和正规方程法。普通最小二乘法使用最小化均方误差来估计模型参数,而正规方程法使用矩阵分解的方法求解线性方程组。这些方法在数据科学和机器学习领域被广泛应用,可以用于预测、建模和估计未知数据。
YingJoy_
2017-10-25
2K0
机器学习实战——训练你的 Flappy Pikachu
前言 皮卡丘又回来啦,由于上一周有些事情要处理,就没有写文章,真的很对不起大家。:( 不过这次笔者给大家带来了一个非常好玩的东西 看标题——机器学习实战——训练你的FlappyPikachu(皮卡丘)
YingJoy_
2017-05-26
8150
谷歌发布PhotoScan:拍摄无炫光的图片
本文介绍了使用智能手机应用进行照片扫描并去除眩光的方法,通过使用增强现实技术对照片进行预处理,消除眩光,提高照片质量。主要步骤包括拍摄照片、对齐照片、去除眩光和优化照片。该算法可以在手机上实时运行,具有快速、准确和易用的特点,适用于各种扫描条件,包括无光泽和光泽打印,照片内部或外部相册,杂志封面等。
YingJoy_
2017-04-24
2.6K0
谷歌论文抢鲜看:教机器画画
本文介绍了使用神经网络来生成基于文本的草图,探讨了不同对象之间的潜在空间,并提出了可以用于创意应用程序的潜在技术。
YingJoy_
2017-04-17
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档