前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >神经网络如同青蛙的智力

神经网络如同青蛙的智力

作者头像
许卉
发布2019-07-15 17:28:39
3860
发布2019-07-15 17:28:39
举报
文章被收录于专栏:Data AnalystData Analyst

神经网络模型

我理解的神经网络模型类似人的记忆,即人从出生到长大,接触、吸收外部信息并且将外部事物量化、统一化、概念化的过程,以此去指导一生的行为。

实际上,神经网络模型ANN是由大量的简单基本元件组成,每个元件的结构和功能都比较简单,但是众多的神经元组合所产生的系统却非常复杂。神经网络模型属于一种较为智能的判别过程,对于变量类型并没有过多要求,可以有效地识别事物的不同特征以及模式,例如不完全的信息、复杂的非线性特征等等。

通常,工作中使用的神经网络模型为弱能的神经网络,其智能程度犹如青蛙、老鼠的智力。目前,较为深层的神经网络模型已经开发了出来,例如谷歌的阿尔法狗便是深层的神经网络,其背后的算法支撑即为贝叶斯算法

其实,并不需要过多的了解、关注神经网络模型背后的底层结构,工作中只需要会使用就可以了。

神经网络是黑箱

项目过程中,很多人会问到使用的建模方法是什么,通常,这个问题我真的很难回答。如果模型的中间层为神经网络,那么该层即为黑箱

我将作为黑箱的隐含层理解为模型的分析过程,每一个隐节点看做一个感知器,即可以产生多个超平面用于预测或者分类,也就是说,这样的黑箱如同人的思考、判断过程,当然了,优缺点并存,神经网络模型在解决预测类问题时具有非常多的有点,但是,神经网络模型也极大的额限制了我们对于变量间具体关系的描述

数据挖掘的速度

数据挖掘领域中,速度非常重要,其重要程度甚至超过了模型的精度,很多业务场景的数据挖掘项目中,往往不惜牺牲商业价值,也要追求速度

神经网络模型也好、决策树模型也好、聚类也好,甚至市场细分模型组合也好,很多都是速度问题,一般我会从几个角度去解决数据挖掘模型的速度问题:

  • 通常,构建模型后预测新样本的方法为,将新样本接在原始样本后,重新跑次模型,从而得到预测数值,即需要跑次模型去得到预测数据,如果样本大些,显然会影响速度。一般,我会只保存训练集的模型,预测新样本时仅仅利用模型进行预测,这样做仅需跑一次模型即可,降低耗时
  • 模型并不是一成不变的,在模型更新维护的过程中,通常的做法是将新数据纳入原数据样本中进行模型的更新迭代,这样便会导致样本更加的庞大,增加了时间成本。一般我仅仅使用新增的数据对模型进行更新,可以理解为人的思维方式,人在学习新鲜事物的时候,并不是回到1岁的状态重新开始学习,不是么

ANN建模过程

神经网络模型的建模过程

  • 构建数据源
  • 设定X、Y与残差,其中X涉及测量级别的确定与标准化的过程,Y涉及误差分布
  • 抽取样本对于隐含层的层数进行测试
  • 通过评分集评估模型好坏
  • 保存训练的模型网络结构,利用该网络对新样本进行预测

建模中的坑

构建神经网络模型的过程中需要注意的大坑很多,例如:

  • SAS EM中有两种神经网络,这两种神经网络与SPSS中的两种神经网络不同
  • 建模前需要进行数据预处理,例如缺失值处理、数据标准化处理等等,数据标准化是数据挖掘中常用的数据处理手段,其优点之一是可以降低建模耗时,并不会影响数据样本原有的性质
  • 确定模型隐含层数时,通常我会抽样一小部分样本,1-5层分别都会测试下模型效果,当然,隐含层数越多模型的效果并不一定会好
  • 我习惯使用R方与残差图去衡量神经网络模型的效果;
  • 如果建模后发现模型准确率很低,可能是缺失值的填充方式出了问题导致模型精度下降,可以从这个角度进行核查;
  • 如果缺失值填补的方法并没有问题,然而模型精度仍然不高,则可能是入模变量的选取出了问题,通常我习惯使用dmine过程步进行入模变量的筛选,从而将大量无用、混杂的变量去掉,从而提升模型的精度。其实这点与传统的模型不同,传统模型中塞入不重要的变量模型并不不会出现什么大的问题,但是神经网络模型必须处理掉无用的垃圾变量,否则模型非常容易出现过拟合,因此神经网络模型在选择最终的入模变量时,需要非常谨慎小心
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Data Analyst 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档