首页
学习
活动
专区
工具
TVP
发布

机器学习与统计学

专栏作者
792
文章
1090524
阅读量
96
订阅数
【统计学基础】从可视化到统计检验,比较两个或多个变量分布的方法总结
因为是随机的所以两组个体不会完全的相同(identical)。但是有时候,它们在总体表现时甚至不是“相似”的(similar)。例如,我们可能在一个群体中有更多的男性,或者年长的人,等等。(我们通常称这些特征为协变量或控制变量)。当这种情况发生时,就不能再确定结果的差异只是由于实验得来的。因此,随机化后,检查所有观察变量是否在组间平衡,是否没有系统差异是非常重要的。
统计学家
2023-01-11
1.7K0
直击人心的数据可视化作品
在这一次疫情中,众媒体运用可视化工具,信息图、数据作品和数据查询小程序等将数据分析可视化叙事,这不仅让新闻报道更加直观形象,更加具有传播力,而且一定程度上揭示了事物间的联系,使表达的观点更加清晰、有效且提高了信息传播的审美价值。
统计学家
2020-12-08
5100
在数据科学中需要多少数学技能?(附链接)
作者:Benjamin Obi Tayo 翻译:刘思婧 校对:车前子 编辑:数据派THU
统计学家
2020-09-22
3790
欢迎挑战!14个数据分析和机器学习项目!附数据集
对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个!
统计学家
2020-05-06
2.6K0
天池 | 疫情数据可视化公益行动
疫情当前,共克时艰,在新型冠状病毒感染的肺炎疫情牵动社会人心的关键时刻,中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动,希望广大开发者围绕疫情态势展示、疫情大众科普、疫情走势预测、疫情物资情况、各地各业人员返工返程情况等需求场景,挖掘复杂异构多源数据之间的关联关系,开发并创作的各种正能量的作品,以形象生动的方式呈现给公众,为夺取防控疫情的胜利贡献力量!
统计学家
2020-02-20
9560
31 个惊艳的数据可视化作品,让你感受“数据之美”!
在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据总是杂乱无章的。
统计学家
2019-12-06
5540
带你建立一个完整的机器学习项目
首先,我们需要预览这个项目。项目的目的是什么,以房价预测为例,数据为StatLib的加州房产数据,那么目的就是预测街区的房产价格中位数。
统计学家
2019-09-03
6290
2019 年人工智能行业又进入冬天了吗?
我们团队是做数据科学咨询的(data analytics consulting),我们一般会跟客户说:“我们帮你做个“人工智能”模型(其实只是简单的预测模型),一年可以给你省xxx多少钱,增长xxx用户。”当然,我们会把这种项目包装为科技转型(technology transformation),告诉客户不升级你就要被时代抛弃了,好让他们买单。这种项目一直都很好卖,尤其是2017年前。各大咨询公司的套路都差不多,从学校拉几个毕业的硕博生,做好PPT(一般咨询公司的PPT中有一页是介绍团队),“编”几个成功案例,去了一般都能顺利把案子签下来。但说到底就是做几个简单的模型(一般就是逻辑回归、决策树和一些传统的统计模型),而这种三四个月左右的项目往往能要到100万美金(大概是4-6个咨询师的钱),显然利润是很丰厚的。那时客户非常依赖我们的专业,因为它们内部的确没有这个方向的人才。而且当新概念起来的时候,每个公司都想尝尝鲜。但从17年后大部分(包括传统行业比如连锁超市、加油站)都基本有了自己的数据团队,他们不再那么相信我们包装的很好的预测模型了。原因很简单:一是大部分咨询产品的质量不高,二是与其付钱给外人还不如自己组建团队(人力成本其实在逐渐下降)。
统计学家
2019-05-17
3380
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档