专栏首页用户7242415的专栏知道数据的分布有什么用
原创

知道数据的分布有什么用

这是我最近在想也没确切的想出来的问题。那我来看看从应用层面来说,看看哪里会用到数据分布吧~

目前的业界对于数据的应用,主要分成两大类:

一类是由数据分析构成的针对已有数据提取信息并整合信息给出推荐;

一类则是由建模构成的预测未来会发生什么的推荐;

针对数据分析构成的应用场景

以统计实验为一项重要的实验研究,广为人知的就是AB testing了,当然还有一些场景需要用判别分析(Discriminant Analysis)来推演;

对于AB testing,需要知道的重要信息就是发生的概率P,而需要预测事情发生的概率,那就需要知道该事件的分布情况,但是常见的AB testing入门应用,就是计算CTR(click trough rate),点击或者不点击,标准的binomial分布了;那其他分布,则需要用拟合优度(goodness-to-fit)来分析了.

针对于由建模构成的应用场景

提前预知数据分布,将运用在以下几个情况,此处通过建模顺序来梳理:

1. EDA (Exploration Data Analytics), 通过简单进行数据探索,看一看他们的分布情况是是否符合预期的商业角度. 例如收入是不是Longtail Distribution 等等.

2. 基础的统计建模,是基于对数据分布的假设. 例如最基本的线性回归模型, 误差项(ε)应呈正态分布;

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 测试思想-测试设计 精简测试用例编写

    大家都知道,测试用例的一个核心作用就覆盖测试需求,尽可能的减少漏测,同时提高测试效率。再细想想,这种核心作用的本质也就是一种“提醒”作用。

    授客
  • 【LightOJ 1136】Division by 3(简单数学)

    1, 12, 123, 1234, ..., 12345678910, ... 问第a到第b个数(inclusive)里有几个可以被3整除。

    饶文津
  • Java工具集-地区(LocaleUtils)

    cwl_java
  • iOS - 老生常谈内存管理(二):从 MRC 说起

    MRC全称Manual Reference Counting,也称为MRR(manual retain-release),手动引用计数内存管理,即开发者需要手动...

    师大小海腾
  • OpenGL ES 学习资源分享

    学习了一段时间的 OpenGL ES,并在公司的项目中得到了运用,也算是有了一些积累,现在分享一些当初学习的资源,大家一起来学习,共同交流进步。

    glumes
  • 【 源码之间 - Flutter 】 FutureBuilder源码分析

    现在回看_FutureBuilderState#initState中对_snapshot进行初始化时: 连接状态是none,数据是提供的初始数据,没有则为nu...

    张风捷特烈
  • Uva_11762 Race to 1

      给一个数n, 每次从小于等于n的素数里选一个P, 如果能被n整除, 那么就n就变成n / P。 

    若羽
  • 「每日五分钟,玩转JVM」:对象哪里来

    众所周知,Java是一门面向对象的高级编程语言,那么现在问题来了,对象从哪来呢?有些人会说通过new关键字来创建一个对象,说的很好,本篇我们就来解密在new一个...

    山禾说
  • HR不得不知的Excel技巧——插件篇

    虽然有些人加的不是班,是技能的短板,但更多的人加的可能是“太老实”了,那些能够投机取巧的插件技能了解一下?

    二号姬
  • 第184天:js创建对象的几种方式总结

    javascript 创建对象简单的来说,无非就是使用内置对象或各种自定义对象,当然还可以使用JSON,但写法有很多,也能混合使用。

    半指温柔乐

扫码关注云+社区

领取腾讯云代金券