用SPSS做数据分析?先弄懂SPSS的基础知识吧

1、SPSS数据分析的流程

2、SPSS特性:

3、数据的编辑:

1

常量

数值型常量:除了普通写法外还可以用科学计数法,如:1.3E18;

字符型常量:用单引号或双引号括起来如果字符中包含单引号,则必须使用双引号;

日期常量:日期个数的数据,一般需要使用日期函数进行转换;

2

变量

变量名长度不能超过8;

三种基本的类型:数值、字符和日期;

可以在variable view界面设定变量的长度及小数位、变量的描述、变量值的描述、missing值、显示宽度、对齐方式和变量的测度方式;

3

变量的测试方式

Scale:定距变量,如:身高、体重等;

Ordinal:定序变量,如:教育程度、级别等;

Nominal:定类变量,如:性别、民族等;

4

操作符与表达式

三种基本的运算:数学、关系和逻辑

数学运算符:+ – * / ** ()

关系运算符:> >= < <= = ~=

逻辑运算符:&(AND) |(OR) ~(NOT)

三种运算对应三种表达式

5

常用的数据操作命令

Data->Sort Cases
Transform->Rank Cases
Transform->Count
Transform->Recode
Transform->Automatic Recode
Transform->Compute
Data->Transpose
Data->Split Files
Data->Merge Files

6

Compute

数值型:compute num1=value.

字符型:String A(a11).compute a=’hello world’.

日期型:compute data1=date.mdy(month,day, year).

7

Rocode

recode variable name(old value=new value).

recode variable name(old value=new value) into new variable name.

字符型变量使用auto recode

8

Split file

有的时候需要对变量做些分组的分析,但一些分析方法并不提供分组变量的设置选项这就需要用到Split file命令;

例如使用 Descriptives 做描述性分析,如果想分年龄做分析,这样就可以用年龄变量做为分组变量;

可以看到这里的Split其实是分组,而不是拆分文件;

9

Merge File

add cases 合并变量相同,但是case不同的文件;

add variables合并变量不同,case相同的文件这里的变量不同可以是部分的变量不同,case相同也可以是一个文件的case是另外一个文件的子集;

10

数据的分类汇总

使用Aggregate命令

指定分类变量对观测量进行分组,对每组观测量的各变量求描述统计量;

11

检查重复的数据

使用identify duplicate cases

12

数据的加权

使用weight case

13

选取一定的case进行分析

使用select cases:在对数据的子集进行分析的时候需要用到这个命令;

14

常用的数学函

取绝对值:abs(数字型表达式)

求余数函数:mod(数字型表达式,模数),模数不能为0该函数在需要对某一变量求模数的余数时使用,如果对一个顺序编号或自然数序列求模数的余数,可将该序列按模数等距分类,从而实行等距抽样;

四舍五入函数:rnd(数字型表达式)

开方函数:sqrt(数字型表达式)

4、基本的统计分析

1

SPSS统计分析概述:

针对不同类型的数据选取不同的分析方法,正确的分析方法是得到正确结果的关键;

spss提供数字分析和图形分析两种分析形式;

高级分析之前一般都需要做描述性统计分析,把握数据的规律对分析解释数据有很好的引导和帮助作用;

2

Descriptive Statistics

Frequencies:频数分析

Descriptives:描述统计

Explore:探索分析

Crosstabs:列联表分析

Ratio:比率分析

3

Descriptives

– 可以对变量进行标准化;

4

Explore

Explore是对连续性变量进行探索性分析最有效的工具;

考察数据的奇异性和分布特征;

箱盒图、茎叶图、正态检验图及方差齐次性检验;

5

Crosstabs

数据类型要求为分类变量;

二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系;

可以做卡方检验,来分析行列变量之间是否存在相关性;

6

分类变量统计描述常用指标

7

Spss操作

8

连续变量的描述指标

9

如何计算各个描述统计量

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2016-03-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏章鱼的慢慢技术路

牛课堂算法直播题目

2918
来自专栏WD学习记录

牛客网 地牢逃脱

给定一个 n 行 m 列的地牢,其中 '.' 表示可以通行的位置,'X' 表示不可通行的障碍,牛牛从 (x0 , y0 ) 位置出发,遍历这个地牢,和一般的游戏...

1073
来自专栏数说工作室

统计师的Python日记【第3天:Numpy你好】

本文是【统计师的Python日记】第3天的日记 回顾一下,第1天学习了Python的基本页面、操作,以及几种主要的容器类型;第2天学习了python的函数、循环...

45212
来自专栏数据结构与算法

BZOJ 4318: OSU!

Description osu 是一款群众喜闻乐见的休闲软件。  我们可以把osu的规则简化与改编成以下的样子:  一共有n次操作,每次操作只有成功与失败之分...

2915
来自专栏阿凯的Excel

巧妙解决二维表信息匹配问题

1452
来自专栏WOLFRAM

九宫格数独游戏

2288
来自专栏ACM算法日常

海战(线段树)- HDU 4027

这一篇是典型的线段树算法,这个算法在日常工作中可能非常少见,因为可以被常规算法所取代,但是在问题达到一定数量级之后,常规算法是很难搞定类似问题的...

952
来自专栏tkokof 的技术,小趣及杂念

Sweet Snippet系列 之 随机选择

  平日工作学习时总会遇到一些令人欣喜的代码段子(Snippet),虽然都很短小,但是其间所含的道理都颇有意味,遂而觉得应该不时的将她们记下,一来算作复习整理,...

1112
来自专栏小樱的经验随笔

单表代替密码原理及算法实现

    要了解单表替代密码就得先了解替代密码,在这里我就做一下简单的介绍:       替代是古典密码中用到的最基本的处理技巧之一 。       替代密码是指...

5406
来自专栏ml

错排公式

错排公式 百科名片 pala提出的问题: 十本不同的书放在书架上。现重新摆放,使每本书都不在原来放的位置。有几种摆法? 这个问题推广一下,就是错排问题: n个有...

4079

扫码关注云+社区

领取腾讯云代金券