首页
学习
活动
专区
工具
TVP
发布

jeremy的技术点滴

专栏成员
197
文章
472190
阅读量
58
订阅数
机器学习课程_笔记04
牛顿方法 首先假设存在一个函数 ,然后算法的目标是找到一个 ,使得 。 牛顿方法的一次迭代: 持续地迭代下去,就可以得到 。 同样的,假设现在存在一个函数 ,也就是对数似然率,目标是找到一个 ,使得 最大化。可以容易想到 的一阶导数 为0时, 即达到最大化了。 同样运用牛顿方法,其一次迭代: 事实证明牛顿方法是一个收敛速度非常快的算法,它的收敛速度用术语可以描述为二次收敛。如果不考虑常量因子,牛顿方法的每一次迭代都会使你正在逼近的解的有效数字的数目加倍。当实现牛顿方法时,对
jeremyxu
2018-05-11
9510
机器学习课程_笔记03
局部加权回归 线性回归算法里的成本函数: image.png 正规方程解出的参数解析表达式: image.png 由于使用了过小的特征集合使得模型过于简单,在这种情形下数据中的某些非常明显的模式没有被成功地拟合出来,我们将其称之为:欠拟合(underfitting)。 由于使用了过大的特征集合使得模型过于复杂,算法拟合出的结果仅仅反映了所给的特定数据的特质,我们可以称之为过拟合。 在特征选择中存在上述两类问题。 这里讲到一类非参数学习算法,可以缓解对于选取特征的需求,就是局部加权回归算法。 这个算法可以让我
jeremyxu
2018-05-11
7362
机器学习课程_笔记06
多项式事件模型 面的这种基本的朴素贝叶斯模型叫做多元伯努利事件模型,该模型有多种扩展,一种是每个分量的多值化,即将\(P(X_i|y)\)由伯努利分布扩展到多项式分布;还有一种是将连续变量值离散化。例如以房屋面积为例: Living area(sq. feet) <400 400-800 800-1200 1200-1600 >1600 \(X_i\) 1 2 3 4 5 还有一种,与多元伯努利有较大区别的朴素贝叶斯模型,就是多项式事件模型。 多项式事件模型改变了特征向量的表示方法: 在多元伯努利模型中,
jeremyxu
2018-05-10
7110
机器学习课程_笔记07
自己的数学知识丢太久了,这一课看了好几篇,最后结合视频及网上的分析文档终于看懂了,汗。。。 最优间隔分类器(optimal margin classifier) 如果训练集是线性可分的, 就是说用超平
jeremyxu
2018-05-10
6570
使用keras破解验证码
今天做一个业务功能时,需要自动登录第三方系统,虽然第三方系统已经给我方分配了用户名及密码,但登录时必须必须输入验证码,如此就很难做到自动化登录了。因为前一段时间研究过机器学习,觉得可以使用keras, tensorflow之类的深度学习框架解决验证码识别的问题。 生成训练数据 机器学习一般都需要比较多的训练数据,怎么得到训练数据呢?主要有以下方法: 1. 手动(累死人系列) 2. 破解验证码生成机制,自动生成无限多的训练数据 3. 打入敌人内部(卧底+不要脸+不要命+多大仇系列) 第1个方法太耗人力,当然依
jeremyxu
2018-05-10
2K0
机器学习课程_笔记01
最近放了一个长假,计划系统地学习下机器学习的基本知识,途径主要是看andrew ng大牛的斯坦福大学公开课-机器学习课程视频,当然在看的过程中为了加深理解,会记下笔记,此篇为第一篇笔记。 机器学习的定义 非正式定义: Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 在不直接针对问题进行编程的
jeremyxu
2018-05-10
7510
tensorflow学习笔记_01
最近看到一个有趣的项目pix2pix-tensorflow。大概功能是用户在网页上画一只猫的轮廓,然后它就可以输出与这个轮廓很相似的猫的清晰图片。出于好奇,就想研究一下这个项目是如何实现的,于是跳入了tensorflow机器学习这个坑。 tensorflow是什么 TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。Tenso
jeremyxu
2018-05-10
6860
tensorflow学习笔记_02
上一篇笔记采用一个线性关系的神经层处理了MNIST的训练数据,最后得到一个准确率一般的神经网络。但其实对于这种图像识别的场景,tensorflow里还可以使用卷积神经网络技术进行准确率更高的机器学习。 卷积与池化 卷积是一个数学上的概念,简单说就是拿卷积核从原始图像里提取特征映射,将一张图片转化为多张包含特征映射的图片。理解卷积可以读一下这篇帖子,里面除了很抽象的数学定义外,还有一些便于理解的示例。 池化主要用来浓缩卷积层的输出结果并创建一个压缩版本的信息并输出。 示例程序 学习卷积神经网络,我也参照官方的
jeremyxu
2018-05-10
6370
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档