前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文梳理SPSS数据分析基础脉络,入门同学必备!

一文梳理SPSS数据分析基础脉络,入门同学必备!

作者头像
博文视点Broadview
发布2020-06-10 16:37:33
1.1K0
发布2020-06-10 16:37:33
举报

“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论是学术界、商界还是政府,所有领域都将开始这种进程。”

——哈佛大学社会学教授 加里•金

我们知道,在信息化时代背景下,大量纷繁复杂的数据和信息充斥在社会的各个领域,为了更加准确、快捷地从中筛选出有价值的部分并根据需要进行一系列数据处理,数据分析过程显得尤为重要。

作为一款功能强大、方便易用的数据分析软件, SPSS 广受数据分析爱好者和从业者的欢迎,所有的功能都以对话框选项的形式呈现, 界面统一、 规范, 用户只要掌握一定的 Windows 操作技能, 通晓一定的统计分析原理,就可以使用该软件。

随着版本的升级, SPSS 的功能愈发强大,被广泛应用于诸多行业及学术研究中。

使用SPSS进行数据分析的优势

SPSS作为世界著名的统计分析软件之一,在对数据进行处理分析时,发挥了不可替代的作用。与同类软件相比,SPSS有以下几点显著优势。

1.操作简便易学

SPSS统计分析软件由于界面友好、操作简单,一般稍有统计基础的人经过几天的培训学习便可以使用SPSS做简单的数据分析,因此,该软件受到广大数据分析人员尤其是非统计专业数据分析人员的青睐。

2.支持编程

SPSS支持丰富的数据源,具有强大的数据访问和管理能力以及编程能力,使用者只需了解统计分析的原理,即便不熟悉统计方法的算法,也可以轻松获得所需要的统计分析结果,同时也支持二次开发。

3.功能强大

SPSS具有完整的数据输入、编辑、统计分析、报表、图形制作等功能,提供完整的数据分析流程,涵盖齐全的数据统计分析方法,如数据的探索性分析、偏相关、方差分析、非参数检验、多元回归、Logistic回归等。同时,SPSS能够读取和输出多种格式的文件,如读取dBASE、FoxBASE、FoxPro产生的文件,还可将图形和表格文件直接转换为Word、Excel、PowerPoint、TXT、HTML、PDF等格式的文件保存。

4.应用广泛

SPSS对于初学者、熟练者及精通者都比较适用,且可应用于经济学、数学、统计学、物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业等领域。

小白必备的SPSS 数据分析流程

数据分析通用的定义为:用适当的统计分析方法对收集来的大量数据进行分析,提取有用的信息和形成结论,而对数据加以详细研究和概括总结的过程。这部分会通过数据的预处理、数据的描述统计、数据的推论统计,来为你描绘一条清晰的SPSS数据分析脉络。

此处只为大家理清脉络,详细操作步骤将在《菜鸟学SPSS数据分析》一书为大家一一讲解。(文末查看本书详情)

1. 数据的预处理

由于计算机不能直接处理现实世界中的具体事物,因此必须先把具体事物转换成计算机能够处理的信息,即同学们需要对数据进行初步的加工、转换(即数据的预处理),以便适合采用相应的统计方法。

那么,在SPSS中涉及预处理的内容有哪些呢?

  • 当你收集了大量的原始数据后,第一步需要将数据录入SPSS中,SPSS可以直接打开多种格式的数据,也可以通过数据库查询导入SPSS中。
  • 在海量的数据中,对数据进行核查
  • 对各个变量进行数据转换,主要集中在【转换】菜单下。
  • 对各个变量进行数据管理,主要集中在【数据】菜单下。
  • 对整个数据文件进行管理,主要集中在【数据】菜单下。

通过以上预处理,原始数据就被转换成合乎统计分析的数据,提高了数据挖掘的质量。

下一步,我们就根据统计分析的目的及变量的特征来选择正确的统计分析方法。

2. 数据的描述统计

当数据整理完毕后,我们需要通过描述统计及统计图表简单直观地了解变量特性。

  • 在SPSS中也可以实现Excel的相关功能,可以制作表格并进行函数计算。
  • 利用统计图表可以更直观地看出数据的各种特征,比较数据间的差异。
  • 在进行数据分析时,首先要对数据有一个大致的了解,了解数据的集中趋势与离散趋势基于此对数据做探索性分析。

同学们通过以上方法了解数据的大致特征,用以辅助选取推论统计方法。

3. 数据的推论统计

推论统计通常是(但并非总是)数据收集和汇总后的下一步,推论统计常利用较小群体的数据来推论可能的较大群体的特征。比如,参数检验和非参数检验,在实际的应用中需要根据具体需求选取正确的统计方法来检验假设是否成立。

1.参数检验

参数检验是在已知或者假设总体分布的情况下对总体的相关参数进行评估检验,描述连续型因变量与分类自变量间的关系,如t检验、方差分析。

(1)t检验(对平均数的差异检验)

(2)方差分析(对平均数的变异分析)

通过分析不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小(方差分析的样本数均在2组以上)。

2.非参数检验

非参数检验是指对于无法获取总体分布情况的相关信息,利用样本数据对总体分布形态等进行推断。以下列举8种非参数检验的方法:

  • 游程检验:检验样本的随机性和两个总体的分布是否相同。
  • 单样本K-S检验:检验样本是否来自特定的理论分布。
  • 二项分布检验:检验样本是否来自二项分布的总体。
  • 两个独立样本的非参数检验:检验两个样本是否来自相同分布的总体。
  • 多个独立样本的非参数检验:检验多个样本是否来自相同分布的总体。
  • 两个相关样本的非参数检验:检验样本来自的两个相关配对总体是否具有显著性差异。
  • 多个相关样本的非参数检验:检验多个相关样本是否来自相同分布的总体。
  • 卡方检验:判断样本是否来自特定分布的总体的检验方法,比较两个或两个以上的样本率(构成比例),以及对两个分类变量的关联性进行分析,其思想是比较理论频数和实际频数的吻合程度或者拟合度。

3.相关分析

相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,研究随机变量之间的相关关系的一种统计方法。比如双变量相关分析和偏相关分析。

(1)双变量相关分析

  • 皮尔逊相关分析:用于度量两个变量间的线性相关关系。
  • 肯德尔等级相关分析、斯皮尔曼等级相关分析:用于分析定类变量或者定序变量的相关关系。

(2)偏相关分析

当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析这两个变量间的相关程度。

综上所述,数据分析是有组织有目的地收集数据、分析数据使之成为有用的信息,从而帮助大家做出判断、采取适当行动对具体业务进行指导的。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 博文视点Broadview 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 BI
腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档