前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Mathematica 11在概率和统计方面的新功能

Mathematica 11在概率和统计方面的新功能

作者头像
WolframChina
发布2018-05-31 14:20:34
1.2K0
发布2018-05-31 14:20:34
举报
文章被收录于专栏:WOLFRAMWOLFRAM

1 1

导读

版本 11 在概率和统计方面添加了大量改进和扩展. 从描述性统计和随机变量到时间序列和随机过程,整体框架更加强大、快速且易于使用.

2 1

案例

下面小编用Mathematica求解几个实例的过程向大家展示其在概率和统计中的应用.

示例1:随机变量的积/商的 PDF

找出 BetaDistribution[2, 3]的 个独立抽样中最小与最大样本比值的概率密度函数.

可视化密度.

计算两个三角形分布的乘积的 PDF.

任何μ为固定值的分布都为重尾分布.

示例2:奇异 PDF 随机取样

用概率密度函数定义公式分布. 密度函数不连续且包含一个无穷奇异点.

从分布中生成随机样本,并比较直方图和密度函数.

In[2]:=sample = RandomVariate[dist, 10^5];

示例3:多元正态性检验

BaringhausHenzeTest 是基于经验特征函数的检验统计的多元正态性检验. 它也被称为 Baringhaus–Henze–Epps–Pulley(BHEP)检验.

检验统计是数据仿射变换中的不变量.

检验统计对于其他每个分布也是一致的. 即,它随样本大小无界增长,除非数据来自高斯分布.

从多元 t 分布和多元正态分布抽取样本.

将 BHEP 检验统计作为样本大小的函数进行计算和可视化.

示例4:心脏疾病数据分析

数据分析是基于从原始数据源提取的信息的提取、演示、建模过程. 本范例展示了用 Wolfram 语言进行数据分析的一个工作流程. 这里使用的数据集来自 UCI Machine Learning Repository,包含了 1,541 名患者的心脏疾病诊断数据.

导入心脏疾病诊断数据,并对其解析使得每行与不同患者相对应,并且每列对应不同属性.

将相关属性提取至 "labels" 和 "features". "labels" 中存储的值为 0 和 1,分别对应心脏疾病的 presence(存在)和 absence(不存在).

对于每位患者,特征向量是数字值的列表. 但是,数据并不完整且缺失域储存为-9 .

用对应属性中可用数据的平均值来置换缺失的值,然后可视化不同属性的关联.

为可视化数据分布, 用 PCA 操作提取前两个分量,然后将投影数据绘在散点图上.

为区分两个分类,用一个二分量高斯混合模型拟合投影数据.

根据混合模型, 绘制混合模型的决策边界(黑色曲线)和概率密度等值线(红色曲线)并与散点绘图一同显示. 高斯混合的第一个分量在决策边界中的概率更高.

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 WOLFRAM 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档