首页
学习
活动
专区
工具
TVP
发布

SeanCheney的专栏

专栏成员
192
文章
387511
阅读量
89
订阅数
《人月神话》要点总结
1.1 编程系统产品(Programming Systems Product)开发的工作量是供个人使用的、独立开发的构件程序的九倍。我估计软件构件产品化引起了 3 倍工作量,将软件构件整合成完整系统所需要的设计、集成和测试又强加了 3 倍的工作量,这些高成本的构件在根本上是相互独立的。
SeanCheney
2022-05-31
3K0
《Pandas 1.x Cookbook · 第二版》第07章 过滤行
Pandas有.clip、.clip_lower、.clip_upper三个方法用于最低值和最高值:
SeanCheney
2021-03-02
5870
《Pandas 1.x Cookbook · 第二版》第05章 探索性数据分析
概括性统计包括平均值、分位值、标准差。.describe方法能计算DataFrame中数值列的统计信息:
SeanCheney
2021-03-02
6180
普华永道全息图解机器学习
几十年来,人工智能研究者的各个「部落」一直以来都在彼此争夺主导权。现在是这些部落联合起来的时候了吗?他们也可能不得不这样做,因为合作和算法融合是实现真正通用人工智能(AGI)的唯一方式。这里给出了机器学习方法的演化之路以及未来的可能模样。
SeanCheney
2021-01-21
6810
《Scikit-Learn与TensorFlow机器学习实用指南》 第11章 训练深度神经网络(下)
训练一个非常大的深度神经网络可能会非常缓慢。 到目前为止,我们已经看到了四种加速训练的方法(并且达到更好的解决方案):对连接权重应用良好的初始化策略,使用良好的激活函数,使用批量规范化以及重用预训练网络的部分。 另一个巨大的速度提升来自使用比普通渐变下降优化器更快的优化器。 在本节中,我们将介绍最流行的:动量优化,Nesterov 加速梯度,AdaGrad,RMSProp,最后是 Adam 优化。
SeanCheney
2020-10-27
1K0
《Scikit-Learn与TensorFlow机器学习实用指南》 第11章 训练深度神经网络(上)
第 10 章介绍了人工神经网络,并训练了我们的第一个深度神经网络。 但它是一个非常浅的 DNN,只有两个隐藏层。 如果你需要解决非常复杂的问题,例如检测高分辨率图像中的数百种类型的对象,该怎么办? 你可能需要训练更深的 DNN,也许有 10 层,每层包含数百个神经元,通过数十万个连接相连。 这可不像公园散步那么简单:
SeanCheney
2020-10-27
5380
《Scikit-Learn、Keras与TensorFlow机器学习实用指南(第二版)》第18章 强化学习
(第二部分:深度学习) 第10章 使用Keras搭建人工神经网络 第11章 训练深度神经网络 第12章 使用TensorFlow自定义模型并训练 第13章 使用TensorFlow加载和预处理数据 第14章 使用卷积神经网络实现深度计算机视觉 第15章 使用RNN和CNN处理序列 第16章 使用RNN和注意力机制进行自然语言处理 第17章 使用自编码器和GAN做表征学习和生成式学习 第18章 强化学习 [第19章 规模化训练和部署TensorFlow模型]
SeanCheney
2020-02-13
1.8K0
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第14章 使用卷积神经网络实现深度计算机视觉
卷积神经网络(CNN)起源于人们对大脑视神经的研究,自从1980年代,CNN就被用于图像识别了。最近几年,得益于算力提高、训练数据大增,以及第11章中介绍过的训练深度网络的技巧,CNN在一些非常复杂的视觉任务上取得了超出人类表现的进步。CNN支撑了图片搜索、无人驾驶汽车、自动视频分类,等等。另外,CNN也不再限于视觉,比如:语音识别和自然语言处理,但这一章只介绍视觉应用。
SeanCheney
2019-12-20
1.7K0
@classmethod和@staticmethod装饰器
@classsmethod 类装饰器:当用此装饰器定义方法时,将类而不是类的实例作为第一个参数,这意味着可以在此方法中直接使用类的属性,而不是特定的实例的属性,因此不必进行硬编码。
SeanCheney
2019-03-04
5690
为什么序号要从0开始
《Why numbering should start at zero》,原文链接: http://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD831.html
SeanCheney
2019-03-04
9820
《Learning Scrapy》(中文版)第8章 Scrapy编程
到目前为止,我们创建爬虫的目的是抓取数据,并提取信息。除了爬虫,scrapy可以让我们微调它的功能。例如,你会经常碰到以下状况:
SeanCheney
2019-02-15
7440
使用Pyppeteer抓取渲染网页
GitHub地址是:https://miyakogi.github.io/pyppeteer
SeanCheney
2019-01-28
6.6K0
《Scikit-Learn与TensorFlow机器学习实用指南》 第07章 集成学习和随机森林
假设你去随机问很多人一个很复杂的问题,然后把它们的答案合并起来。通常情况下你会发现这个合并的答案比一个专家的答案要好。这就叫做群体智慧。同样的,如果你合并了一组分类器的预测(像分类或者回归),你也会得到一个比单一分类器更好的预测结果。这一组分类器就叫做集成;因此,这个技术就叫做集成学习,一个集成学习算法就叫做集成方法。
SeanCheney
2018-09-19
6420
《Scikit-Learn与TensorFlow机器学习实用指南》 第06章 决策树
和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务, 甚至包括多输出(multioutput)任务.
SeanCheney
2018-09-19
1.1K0
《Scikit-Learn与TensorFlow机器学习实用指南》 第4章 训练模型
在之前的描述中,我们通常把机器学习模型和训练算法当作黑箱来处理。如果你动手练习过前几章的一些示例,就能惊奇地发现优化回归系统、改进数字图像的分类器、甚至可以零基础搭建一个垃圾邮件的分类器,但是却对它们内部的工作流程一无所知。事实上,许多场合你都不需要知道这些黑箱子的内部有什么,干了什么。
SeanCheney
2018-09-19
9250
《Scikit-Learn与TensorFlow机器学习实用指南》 第3章 分类
在第一章我们提到过最常用的监督学习任务是回归(用于预测某个值)和分类(预测某个类别)。在第二章我们探索了一个回归任务:预测房价。我们使用了多种算法,诸如线性回归,决策树,和随机森林(这个将会在后面的章节更详细地讨论)。现在我们将我们的注意力转到分类任务上。
SeanCheney
2018-09-19
1.2K0
《图解算法》总结第1章 算法简介第2章 选择排序第3章 递归第4章 快速排序第5章 散列表第6章 广度优先搜索第7章 狄克斯特拉算法第8章 贪婪算法第9章 动态规划
Grokking Algorithms: An illustrated guide for programmers and other curious people 这篇文章是《图解算法》一书的摘抄总结。 原书标题是《Grokking Algorithms》,grok是中文“意会”的意思,韦伯斯特的解释是“to understand profoundly and intuitively ”,英语的原意是强调深入直观地理解。有意思的是,今年的最后一天,2017年12月31日,还会出版另一本Grokki
SeanCheney
2018-04-24
1.6K0
阿姆达尔定律和古斯塔夫森定律摘要背景建议使用指南更多资源
摘要 构建软件的并行版本可使应用在更短的时间内运行指定的数据集,在固定时间内运行多个数据集,或运行非线程软件禁止运行的大型数据集。 并行化的成功通常通过测量并行版本的加速(相对于串行版本)来进行量化。 除了上述比较之外,将并行版本加速与可能加速的上限进行比较也十分有用。 通过阿姆达尔定律和古斯塔夫森定律可以解决这一问题。 本文是“英特尔多线程应用开发指南”系列的一部分,该系列介绍了针对英特尔® 平台开发高效多线程应用的指导原则。 背景 应用运行的速度越快,用户等待结果所需的时间越短。 此外,执行时间的缩短使
SeanCheney
2018-04-24
1.3K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档