首页
学习
活动
专区
工具
TVP
发布

Brian

专栏作者
72
文章
129620
阅读量
22
订阅数
结构化机器学习流程
机器学习可以通过结构化的流程来梳理:1.定义问题和需求分析->2.数据探索->3.数据准备->4.评估算法->5.优化模型->6.部署。
吕海峰
2018-08-08
1.1K0
Windows Azure 机器学习与云计算概述
Azure 机器学习是集成式的端到端数据科学和高级分析解决方案。 它可让数据科学家以云的规模准备数据、开发试验和部署模型。 Azure 机器学习的主要组件包括:
吕海峰
2018-08-08
1.1K0
机器学习常用算法-k近邻算法
概述 今天介绍一下机器学习常用算法,以及常用的数据处理技巧等。我们都知道机器学习针对特定任务从经验中学习,并且使得我们的任务效果越来越好。我们看一机器学习的workflow,如下所示: 数据采集和标记->数据清洗->特征选择->模型选择->模型训练和测试->模型性能评估和优化->模型使用即上线。 我们一般通过Python来实现机器学习常用算法的程序,所以基于Python语言常用的机器学习类库及其第三方扩展库有:IPython,Jupyter,numpy,matplotlib,scipy,scikit-lea
吕海峰
2018-07-03
8450
机器学习常用算法-线性回归算法
概述 有时候我们需要预测连续值的映射关系,比如房价预测问题。不想之前的是几个类别,它的输出值是实数。这个时候一般通过线性回归算法进行拟合。 线性回归 h_\theta(x)=\theta_0+\theta_1x 上面这个例子是针对数据集x和y,预测函数根据数据输入x会预测出h(x),我们的目的是找出一个合适θ参数值,是的预测值h(x)和y值的整体误差最小。我们一般通过均方差成本函数来衡量模型对训练样本拟合的好坏程度。如下: J(\theta)=J(\theta_0,\theta_1)=\frac 1{2
吕海峰
2018-06-13
6820
机器学习性能度量
---- 概述 我们在进行机器学习时需要衡量机器学习的优劣和本身模型的准确程度,比如简单的衡量数据的准确率和错误率,但是我们更关心的是模型的泛化能力的指标,即基于模型的所选的item相关性以及模型分类指标的好坏。 机器学习度量 error rate(错误率):把分类错误的样本数占样本总数的比例。E=a/m accuracy(精确度):分类正确的样本数占样本总数的比例。acc=1-E training error(训练误差):学习器在训练集上的误差。 generalization error(泛华误差):在新
吕海峰
2018-04-03
6000
机器学习读书笔记一
---- 概述 最近在看周教授的《机器学习》,书中很多理论知识非常适合入门和学习。故把每一章的自己读书笔记和记录给写下来。 基本术语 机器学习:机器学习致力于研究如何利用经验来改善系统自身的性能。机器学习所研究的内容是关于在计算上从数据中产生模型的算法。 书中通过西瓜的例子生动的阐述了很多内容,比如收集了一些西瓜数据:(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂=硬挺;敲声=沉闷),…… Data Set:记录的集合,比如这些西瓜数据。 Instance:每条记录是关于一个事件或者对象。 At
吕海峰
2018-04-03
5030
机器学习之K近邻算法
---- 概述 AI不断的火起来了,作为工程化的码农,也得奔向国际化轨道了。至于机器学习是什么,不知道找百科。现在大多数机器学习都是采用监督学习形式。我们学习一下KNN算法。 KNN KNN(K近邻)算法属于监督学习的分类问题,采用不同feature之间的距离方法进行分类。 1.优点:精度高、对异常值不敏感、无数据输入规定,不需要训练算法。 2.缺点:计算复杂度和空间复杂度高。 3.原理:依据训练样本集中的每个数据对应一个标签,每个数据集中每一个数据与分类一一对应关系,输入没有标签的数据后KNN算法将新数据
吕海峰
2018-04-03
4970
数据挖掘
---- 概述 最近一直在学习数据挖掘和机器学习,无论是是服务端开发人员还是web开发人员,个人觉得最起码都要都一些最基本的数据挖掘和机器学习知识。废话少说,我们先来学习一下数据挖掘的是什么意思?个人的理解是从业务数据中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势。也就是说我们从数据中挖掘到符合我们所需的目标。 数据挖掘的分解 目标定义-》数据采样-》数据整理-》模型评价-》模型发布。 所谓目标定义即定义我们到底需要做什么,目标的定义往往来源于需求,这里不去具体的阐述。 为了确保数据完整、各项属
吕海峰
2018-04-03
1.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档