前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数学建模学习笔记:离散变量联列表检验

数学建模学习笔记:离散变量联列表检验

作者头像
用户7010445
发布2020-03-03 14:46:09
6800
发布2020-03-03 14:46:09
举报

找到了一篇2018年研究生数学建模C题获奖论文——对恐怖袭击事件记录数据的量化分析。自己去年也参加了并且选择的也是这道赛题,然而实力有限并没有最终完成论文。好好学习这篇论文的思路。

关于赛题
  • 赛题第一问:对恐怖袭击事件的危害程度建立量化分析模型。论文中的思路:(1)根据一定标准筛选变量;(2)数值变量标准化,分类变量进行哑变量;(3)主成分分析计算每个变量的权重和危害系数得分F值;(4)对F值进行K-Means。
  • (主成分分析好像是只能用于连续型变量,不能用于离散变量,这篇文章里对分类变量进行哑变量处理后如何进行主成分分析自己还没太想明白)。
  • 赛题提供的原始数据量非常庞大,第一步肯定是对原始数据进行预处理,自己当时也想到了,但是根据什么标准来处理数据自己当时是一点思路也没有。这篇文章里筛选数据的标准:(1)删除缺失比例超过85%的变量;(2)删除确实比例超过50%的样本;(3)根据文献和主观因素,确定影响恐怖事件危害级别的主要因素是财产损失程度和伤亡人数,其他变量与这两个变量做相关性,删除掉与这两个变量相关性小的变量。
  • 离散变量与财产损害程度进行卡方检验。
  • 数值变量pearson相关性检验。
实例(R语言)

以下实例来自参考书《数学建模基于R》

  • Pearson X2(卡方)独立性检验 原假设H0:X与Y独立 备择假设H1:X与Y不独立(相关)

实例:月收入与工作满意度是否相关

工资收入

很不满意

较不满意

基本满意

很满意

合计

<3000

20

24

80

82

206

3000~7500

22

38

104

125

289

7500 ~ 12000

13

28

81

113

235

12000 | 7 | 18 | 54 | 92 | 171 合计 | 62 | 108 | 319 | 412 | 901

R分析代码

代码语言:javascript
复制
> x<-c(20,24,80,82,22,38,104,125,13,28,81,113,7,18,54,92)
> X<-matrix(x,ncol=4,byrow=T)
> X
     [,1] [,2] [,3] [,4]
[1,]   20   24   80   82
[2,]   22   38  104  125
[3,]   13   28   81  113
[4,]    7   18   54   92

> chisq.test(X)

    Pearson's Chi-squared test

data:  X
X-squared = 11.989, df = 9, p-value = 0.214

P值大于0.05,接受原假设,即个人收入与工作满意度无关。

  • Fisher精确独立检验 在样本数较少时(单元的期望频数小于4),需要用Fisher精确检验来完成独立性检验 实例:乙肝免疫球蛋白预防胎儿宫内感染HBV的效果

组别

阳性

阴性

合计

预防注射组

4

18

22

对照组

5

6

11

合计

9

24

11

代码:

代码语言:javascript
复制
> x<-c(4,5,18,6)
> X<-matrix(x,ncol=2)
> X
     [,1] [,2]
[1,]    4   18
[2,]    5    6
> fisher.test(X)

    Fisher's Exact Test for Count Data

data:  X
p-value = 0.121
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.03974151 1.76726409
sample estimates:
odds ratio 
 0.2791061

P值>0.05并且优势比的置信区间包含1,由此说明两变量是独立的,即认为总体感染率并无差异。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 关于赛题
  • 实例(R语言)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档