首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R 语言介绍未完待续

我们分析数据的方式在近年来发生了令人瞩目的变化。随着个人电脑和互联网的出现,可获

取的数据量有了非常可观的增长。商业公司拥有TB级的客户交易数据,政府、学术团体以及私

立研究机构同样拥有各类研究课题的大量档案和调查数据。从这些海量数据中收集信息(更不用

说发现规律)已经成为了一项产业。同时,如何以容易让人理解和消化的方式呈现这些信息也日

益富有挑战性。

数据分析科学(统计学、计量心理学、计量经济学、机器学习)的发展一直与数据的爆炸式

增长保持同步。远在个人电脑和互联网发端之前,学术研究人员就已经开发出了很多新的统计方

法,并将其研究成果以论文的形式发表在专业期刊上。这些方法可能需要很多年才能够被程序员

改写并整合到广泛用于数据分析的统计软件中。而如今,新的方法层出不穷。统计研究者经常在

人们常访问的网站上发表新方法和改进的方法,并附上相应的实现代码。

个人电脑的出现还对我们分析数据的方式产生了另外一种影响。当数据分析需要在大型机上

完成的时候,机时非常宝贵难求。分析师们会小心地设定可能用到的所有参数和选项,再让计算

机执行计算。程序运行完毕后,输出的结果可能长达几十甚至几百页。之后,分析师会仔细筛查

整个输出,去芜存菁。许多受欢迎的统计软件正是在这个时期开发出来的。直到现在,统计软件

依然在一定程度上沿袭了这种处理方式。

随着个人电脑将计算变得廉价且便捷,现代数据分析的方式发生了变化。与过去一次性设置

好完整的数据分析过程不同,现在这个过程已经变得高度交互化,每一阶段的输出都可以充当下

一阶段的输入。一个典型的数据分析过程的示例见图1-1。在任何时刻,这个循环都可能在进行

着数据变换、缺失值插补、变量增加或删除,甚至重新执行整个过程。当分析师认为他们已经深

入地理解了数据,并且可以回答所有能够回答的相关问题时,这个过程即告结束

个人电脑的出现(特别是高分辨率显示器的普及)同样对理解和呈现分析结果产生了重大影

响。一图胜千言,绝对如此!人类非常擅长通过视觉获取有用信息。现代数据分析也日益依赖通

过呈现图形来揭示含义和表达结果

今天的数据分析人士需要从广泛的数据源(数据库管理系统、文本文件、统计软件以及电子

表格)获取数据,将数据片段融合到一起,对数据做清理和标注,用最新的方法进行分析,以有

意义有吸引力的图形化方式展示结果,最后将结果整合成令人感兴趣的报告并向利益相关者和公

众发布。通过下面的介绍你会看到,R正是一个适合完成以上目标的理想而又功能全面的软件。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181208A0TG4T00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券