作者:石鹏 审核:云航 封面:自己想吧
在工作中常常会遇到这样的情况,有 n 个由多个指标反映的客体,但是反映客体的指标个数是多少不清楚,甚至指标本身是什么也是模糊的,更谈不上直接测量或观察它,仅仅所能知道的是这 n 个客体之间的某种距离(相异性)或者是某种相似性。我们希望仅由这种距离或者相似性给出的信息出发,在较低维的欧氏空间把这 n 个客体(作为几何点)的相似程度用图形表达出来。从而可能通过相关的专业知识揭示这 n 个客体之间的真实结构关系。这就是多维尺度分析所要研究的问题。
多维尺度分析
基本原理
多维尺度分析(multidimensional scaling, MDS)又译作多为标度分析,是多元统计分析方法的一个新分支,是主成分分析和因子分析的一个自然延伸,是信息科学中一项公认的统计分析方法,是一组用于信息可视化和降维的相关排序技术,可以把数据库中案例的相似性进行可视化表达。基本原理是通过某种非线性变换,把高维空间的几何图形转化成低维空间的图形,变换后的图形仍能近似地保持原图形的集合关系。这些点所在的空间是欧几里得空间,可以是二维、三维或多维。
多维尺度分析处理的数据是一般是表示事物之间的接近性的观察数据,既可以是实际距离,也可以是主观评判的相似性,目的就是要发现决定多个事物之间距离的潜在维度,用较少的变量对事物之间的相似性作出解释。
多维尺度分析的输出结果是一种图谱,表现了各元素之间的关系,越相似的元素在空间上就越接近。从图谱中,研究者可以通过观察图谱的组织结构来推断数据集的基本维度或确认先前的假设。多维尺度分析通常以二维空间定位,侧重说明知识单元之问的相对关系,在边界界定及词类关联上需要结合特定内容和知识基础进行解释。
多维尺度分析
基本步骤
1、根据数据类型,选择合适的分析方法
在进行多维尺度分析时,首先应该判断数据的性质,若待分析的数据是精确的描述对象特点的数值型数据,则可以选用度量型多维尺度分析,若待分析的数据仅是描述事物之间相似性或差异性的等级数据,则可以选用非度量型多维尺度分析。
另外,还要注意结合获得数据的方式。以市场调查为例,若数据是针对不同受访者获得的,则每个受访者给出的结果数据即为一个矩阵,此时对不同受访者的数据取均值采用一般的多维尺度分析是不合适的,这样做会损失大量的信息,所以应采用考虑个体差异的多维尺度分析。
2、根据评价标准,确定合适的维数
多维尺度分析的目标就是以较少的维数空间去较好的拟合获得的数据。通常,维数越高,空间图对资料的拟合度越高,随着维数的减少,维度的实际意义将更容易归纳,但这是以损失部分原始数据信息为代价的。所以,选择合适的维数至关重要。
一般而言,维数的确定主要参考两点:
※ 专业知识、文献资料或预实验的结果和结论
※ 空间图的解释能力,一般来说,想要解释三维以上的空间图是很困难的
3、评价获得的结果
对多维尺度分析获得的结果进行有效性和可靠性评估,方法主要有以下三种:
※ 计算拟合劣度值或拟合优度值
※ 计算压力(stress)值
※ 计算梯度收敛值和单调收敛值,一般要求梯度收敛标准为0.01,单调收敛标准为0.01
4、解释结果的实际意义
主要是对坐标轴进行命名,根据空间图对对象进行分类,坐标轴的命名主要依赖专业知识和统计分析结果。
接下来我们将对多维尺度分析进行详细讲解,敬请期待~
作者简介
姓名:石鹏
院校:中国医科大学
擅长方法:多元回归分析
领取专属 10元无门槛券
私享最新 技术干货