首页
学习
活动
专区
工具
TVP
发布

应兆康的专栏

专栏作者
162
文章
299022
阅读量
63
订阅数
Python使用本地shadowsocks代理
Python使用本地的ss代理 使用: proxies={ 'http': 'socks5://127.0.0.1:1080', 'https': 'socks5://127.0.0.1:1080' } 会报错, 获取无法连接 requests.exceptions.ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response')) url
YingJoy_
2018-12-14
14.7K2
Selenium放弃PhantomJS改用Chrome headless
现在还可以通过使用Chrome或Firefox的headless方式来进行无界面的浏览器模拟。
YingJoy_
2018-12-14
1.2K0
Spring Boot 简单入门
application.yml的内容: spring: profiles: active: xxx
YingJoy_
2018-09-14
6000
Flask中的AJAX文件上传
表单: <form method="post" enctype=multipart/form-data id='form1'> <input class="form-control" id="image" name="image" required type="file"> <button type="submit" class="btn btn-default" id='submit1'>提交</button> </form> JS: <script> $('#image').change
YingJoy_
2018-09-14
2.7K0
Python Web - Flask笔记10
编写uwsgi配置文件: 在项目的路径下面,创建一个文件叫做yingjoy_uwsgi.ini的文件,然后填写以下代码: [uwsgi] # Django相关的配置 # 必须全部为绝对路径 # 项目的路径 chdir = /srv/yingjoy # Django的wsgi文件 module = yingjoy.wsgi # Python虚拟环境的路径 home = /root/.virtualenvs/django-env-py2 # 进程相关的设置 # 主进程 master = true # 最大数量的工作进程 processes = 10 # socket文件路径,绝对路径 socket = /srv/yingjoy/yingjoy.sock # 设置socket的权限 chmod-socket = 666 # 退出的时候是否清理环境 vacuum = true 然后使用命令uwsgi --ini yingjoy.ini,看下是否还能启动这个项目。 安装nginx:
YingJoy_
2018-09-14
5030
OpenCV+TensorFlow 人工智能图像处理 (2)
[[1, 0, 100], [0, 1, 200]] 转变为2个矩阵: [[1, 0], [0, 1]] 和 [[100], [200]] 分别对应A和B矩阵,原图像为C[x, y] A * C + B = [[1x+0y], [0x+1y]] + [[100], [200]]
YingJoy_
2018-09-14
6960
计算机网络笔记 —— 物理层 1
物理层上数据是以信号的方式传输的 信号是数据的电气或电磁表现,信号分为模拟信号和数字信号
YingJoy_
2018-08-02
5230
Python Web - Flask笔记6
mysql级别的外键,还不够ORM,必须拿到一个表的外键,然后通过这个外键再去另外一张表中查找,这样太麻烦了。SQLAlchemy提供了一个relationship,这个类可以定义属性,以后在访问相关联的表的时候就直接可以通过属性访问的方式就可以访问得到了。示例代码:
YingJoy_
2018-08-02
1.9K0
Python Web - Flask笔记1
1. 课程准备 环境 Python 3.6 IDE: PyCharm 2018.2 安装虚拟环境 virtualenv 安装Flask pip install flask 2. 认识Web 2.1 U
YingJoy_
2018-08-02
5290
Adjusted R-Squared
拟合度:调整R方 $\hat{R}^2=1-\frac{RSS/(n-d-1)}{TSS/(n-1)}$ 其中: * RSS为残差平方和 * TSS为总平方和 * n为观测值 * d为特征值 ESS: 回归平方和回归方程中含有截距项时TSS=RSS+ESS 否则上述公式不成立。
YingJoy_
2018-08-02
7500
AdaBoost
分配给每个观测样本$X_i$一个初始权重$W_i$。$W_i=\frac{1}{n}$,其中$n$为样本总数 训练一个“弱模型”(常用决策树) 对于每一个测试样本 3.1 如果预测错误, $W_i$
YingJoy_
2018-08-02
3100
Accuracy
$A_{cc}=\frac{1}{n}\sum{I(\hat{y}_i=y_i)}$
YingJoy_
2018-08-02
2160
26. 训练集误差分析
你的算法必须在训练集上表现得很好,才能期望它在开发集和测试集上能够有着良好的表现。除了先前提到的用于处理高偏差的技术外,我通常也会在训练数据上进行误差分析,处理方式类似于在开发集上设置一个 Eyeball 开发集。当你的算法有着高偏差时(例如算法没有很好拟合训练集的时候)这将有所帮助。 举个例子,假设你正在为一个应用程序构建一个语音识别系统,并收集了一组志愿者的音频片段。如果系统在训练集上表现不佳,你可能会考虑以约 100 个算法处理得很差的样本作为一组并人为去听它们,从而知道训练集误差的主要种类。类似于
YingJoy_
2018-06-06
4972
26. 训练集误差分析
你的算法必须在训练集上表现得很好,才能期望它在开发集和测试集上能够有着良好的表现。除了先前提到的用于处理高偏差的技术外,我通常也会在训练数据上进行误差分析,处理方式类似于在开发集上设置一个 Eyeball 开发集。当你的算法有着高偏差时(例如算法没有很好拟合训练集的时候)这将有所帮助。 举个例子,假设你正在为一个应用程序构建一个语音识别系统,并收集了一组志愿者的音频片段。如果系统在训练集上表现不佳,你可能会考虑以约 100 个算法处理得很差的样本作为一组并人为去听它们,从而知道训练集误差的主要种类。类似于开发集上的误差分析,你可以计算不同类别的错误样本数量:
YingJoy_
2018-06-04
1.4K2
开发集和测试集应该来自同一分布
6 开发集和测试集应该来自同一分布 根据市场情况,由于存在不同地区的用户,你可以把你的猫咪APP图片数据分为四个区域: (1) 美国 (2) 中国 (3) 印度 (4) 其它地区 为了生成一个开发集和测试集,你可能会随机的分配两个地区的数据到开发集中,另外两个作为测试集。比如:来自美国和印度的数据作为一类,来自中国和其它地区的数据作为另一类。 一旦你这样划分了数据集,你的团队可能会主要关注提高在开发集的上的性能。开发集应该能够正确的反映出你的整体情况,而不是局部情况。比如这里主要提升了APP
YingJoy_
2018-05-30
3540
开发集和测试集应该多大?
7 开发集和测试集应该多大? 开发集应该足够大,大到可以检测出不同算法之间的差异。比如:如果分类器A的精度为90.0%,分类器B精度为90.1%。如果你的开发集只有100条,那么你可能检测不出这0.1%的差异,与其它机器学习的问题相比,100条数据很小,常见的开发集数据规模在1000到10000条之间。数据量越高,模型之间的差异越明显。[2] 对于一些成熟的重要应用来说(如:广告推荐,网页推荐,产品推荐等)。我经常看到团队在为0.01%的性能提升而奋斗,因为这直接影响到了公司的利润。在这种情况下,开发集的数
YingJoy_
2018-05-30
3800
Andrew Ng - 《Machine Learning Yearning》 Chapter 15-19
Machine Learning Yearning. 全新版本 本书作者是Andrew NG 此处为15-19章 当你准备开始一个新的机器学习项目时,你该怎么选择前途比较好的工作方向?这些章节将详
YingJoy_
2018-05-30
4540
9. 优化指标和满足指标
9 优化指标和满足指标 这里有组合多个评价指标的另一个方法。 假设你同时关系算法的精度和运行时间。你需要在如下分类器中进行选择: 分类器 精度 运行时间 A 90% 80ms B 92% 95ms C 95% 1,500ms 如果将精度和运行时间按照下面的公式进行组合可能看起来不太自然: 精度 – 0.5*运行时间 你可以这样做:首先定义一个可接受(acceptable)的运行时间。例如任何运行时间在100ms内都是可以接受的。然后再在满足运行时间要求的分类器中选择精度最高的。在这里运行时间
YingJoy_
2018-05-30
8780
11. 什么时候更改开发/测试集和评估指标
11. 什么时候更改开发/测试集和评估指标 当开始一个新项目的时候,我会试图快速的选择开发/测试集,因为这样可以给团队一个很明确的目标。 我通常会要求我的团队在不到一周的时间内(几乎不会超过这个时间)提供一个初始的开发/测试集和评估指标,并且提出一个不太完美的方案迅速行动起来,这比花更多的时间去思考更好。但在一些比较成熟的应用上,一周时间可能不够,比如:反垃圾邮件(anti-spam)是一个成熟的深度学习应用。我见过一些团队会花费数月的时间在已完成的成熟系统上,去获得更好的开发集/测试集。 如果之后发现
YingJoy_
2018-05-30
3640
12. 小结:建立开发集和测试集
• 从分布中选择开发集和测试集 ,它需要反映你将来的数据情况,并且它的效果足够好,这可能与训练的数据不在同一分布。 • 尽可能在同一分布选择你的开发集和测试集。 • 为你的团队选择一个单一数字的评估指标来进行优化。如果你关心多个指标,你可以把它们合并到一个指标中(例如:平均多个错误指标),或设定满足指标和优化指标。 • 机器学习是一个高度迭代的过:在发现你满意的结果之前需要尝试大量的idea。 • 开发/测试集和单一数字指标可以帮助你快速的评估算法,从而迭代的更快。 • 当
YingJoy_
2018-05-30
2620
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档