前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >天造地设的主成分与神经网络

天造地设的主成分与神经网络

作者头像
许卉
发布2019-07-15 17:29:46
4590
发布2019-07-15 17:29:46
举报
文章被收录于专栏:Data AnalystData Analyst

主成分与聚类能否自由切换?

分析架构中常常会涉及到主成分分析的环节,我常常会想,这部分主成分分析能不能用聚类分析去替代呢?结论是不能~

首先,两者强调的重点不同,聚类分析强调的是列与列之间的整合关系,其强项是抽象因子的提取,而主成分分析并不擅长因子的解释,其强项为压缩技术

其次,如果分析架构中嵌入了聚类分析,则很进行新样本的预测,数据流转到此环节,分析便戛然而止,数据无法继续向下流动,这种情况便导致嵌入聚类分析的目标不再是新样本的预测,转而变成了老样本的预测,并且解决的是结构性的问题;如果分析架构中嵌入了主成分分析,则此环节的分析虽可以对新老样本进行预测,但是却无法解决结构性的问题

我将他们理解为完全不一样的分析手段。

data analyst

到底用哪个?

聚类分析与主成分分析的分析目的、侧重点不同:

  • 如果分析目的是构建规则与规则筛选,则聚类更为适用;
  • 如果分析目的是预测样本,则主成分分析更为适用。

data analyst

神仙眷侣的主成分与神经网络

主成分与神经网络CNN结合即为主成分神经网络,他们既有相似的地方,也有互补的地方。

相似之处,例如,主成分与神经网络都可以进行新老样本的预测,主成分不擅长解释X之间的关系,没关系,神经也不擅长,神经网络甚至根本无法解释模型中间的暗箱技术

互补之处,例如主成分解决的就是列的压缩问题,而神经网络对于样本列的压缩求之不得,正好,一拍即合

所以啊,主成分与神经网络真的是天造地设的一对儿,主成分中最具有代表性的并不是主成分回归,而是主成分神经网络

data analyst

主成分与决策树方法相克

通常,很少将主成分与决策树结合使用。

决策树专攻结构性问题,然而结构性问题却不是主成分的强项,决策树与主成分结合后虽可以解决预测性的问题,但是与神经网络CNN、logistic相比,效果一定是大打折扣。究其原因在于决策树对于X的要求更加苛刻,X的数量不能过多,而神经网络则对变量的数量无过多限制,因此决策树与主成分相结合并不能对新样本进行预测

所以主成分与决策树很少一起使用。

data analyst

主成分如何预测新样本?

主成分预测新样本并不复杂,下图是基本的预测流程。

即:

  • 通过带Y的原始数据生成碎石图,确定主成分的个数,并保存主成分结构;
  • 利用主成分结构对新样本进行处理,目的在于得到新样本的主成分分值
  • 将主成分结构封装成模型,对新样本的主成分分值进行预测,从而得到最终的预测概率
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Data Analyst 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档