前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《R语言游戏数据分析与挖掘》新书推荐

《R语言游戏数据分析与挖掘》新书推荐

作者头像
小莹莹
发布2018-04-23 16:06:27
1.1K0
发布2018-04-23 16:06:27
举报
文章被收录于专栏:PPV课数据科学社区

作者:谢佳标

微软中国MVP,多届中国R语言大会演讲嘉宾,目前在创梦天地担任高级数据分析师一职, 作为创梦天地数据挖掘组的负责人,带领团队对游戏数据进行深度挖掘,主要利用R语言进行大数据的挖掘和可视化工作。

《R语言游戏数据分析与挖掘》新书上市已经有一个多月,各大网店均有销售。这是一部从大数据技术和游戏业务双重维度讲解如何利用结果数据指导商业决策的实战性著作,乐逗游戏高级数据分析师撰写,是他近10年数据挖掘与分析经验的总结。数据是无价的,只有当数据被挖掘分析并帮助到企业的时候才是有价值的。传统的数据分析类图书重技术而轻业务,本书二者并重:技术方面,以游戏数据的挖掘与分析为核心,辐射游戏数据处理的各个环节,系统讲解游戏数据挖掘与分析的技术、方法论和工具;业务方面,所有案例的讲解过程中都对相关业务进行了重点解读,旨在加深数据分析师对游戏业务的理解和思考,从而更好地利用R语言技术解决游戏数据处理中的各种复杂问题。

很多读者担心自己没有R语言的基础是否适合此书,也有另外一些读者担心此书是否偏向游戏行业,不适合其他行业的数据分析师阅读。其实这些担忧都是多虑的,本书分为基础篇、实战篇和提高篇三大篇章,初学者也能通过学习基础篇的知识掌握R语言使用技巧,包括R语言数据对象、数据导入、数据处理、初级绘图和高级绘图等知识;实战篇是通过数据挖掘技术,对用户和收入进行深度挖掘,这些实战案例的解决方案具有行业通用性,可以很好地将思路移植到其他行业领域中;提高篇又分为rattle和shiny,rattle是一款优秀的R语言数据挖掘工具,shiny是RStudio公司开发的一个网页app开发框架,可以快速搭建数据分析挖掘原型,让不懂前端知识的数据分析师也具有平台开发能力。

基础篇包括游戏数据分析理论、R常用技巧和绘图技巧,R基础软件下载安装、扩展包(package)的安装,并详细介绍了如何将文本文件、excel文件、MySQL数据库数据、网络数据读入到R中,最后R三大绘图系统:base系统、lattice系统和ggplot系统的绘图技术以及交互式绘图(rCharts包、recharts包、plotly包以及其他基于HTMLWidgets包开发的交互包)。

实战篇包括数据处理技巧、路径行为分析、付费偏好深度挖掘已经各种分类算法的原理及R实现(KNN近邻、朴素贝叶斯、决策树、bagging、boosting、随机森林、人工神经网络以及支持向量机等算法),并利用caret包进行十折交叉验证选择最优模型。比如在对付费用户偏好的深度挖掘中,针对游戏用户总结了几种常用的数据挖掘技术:

其中,关联规则分析是购物篮经常应用的一种挖掘技术,基于物品协同过滤的方法来对玩家进行TopN商品推荐是目前电商流行的推荐算法之一,并利用社会网络分析中的社群发现技术研究用户购买物品的偏好。

在渠道用户质量分析一章中,书中借鉴时间管理理论中一个非常重要的四象限法则,对渠道用户进行象限划分,进而研究不同渠道的用户质量情况。书中利用Median-IQR方法分析ARPPU、ARPU、新增次日留存率和新增七日留存率等指标,查看不同渠道在一月份数据的集中及离散程度。这里使用中位数作为衡量中心的统计量,应用四分位距(IQR)作为离散指标的统计量更有意义。与更常用的均值和标准差相比,这些统计量在有离群值存在时更加稳健。

由于传统的数据分析技术都是针对单一维度进行研究,这样并未考虑到维度间的关系,本章最后还提出用户质量打分模型,利用能体现用户数量、用户质量和用户收入等原始指标,进行模型指标转化,并得到渠道用户质量得分,进而对渠道用户优劣进行综合评价。

在提高篇详细介绍了R语言数据挖掘工具Rattle,此工具能够在一个图形化的界面上完成数据导入、数据探索、数据可视化、数据建模和模型评估整个数据挖掘流程;最后一章介绍了Web开发框架shiny包,使得R的使用者不必太了解CSS、JS,只需要了解一些HTML的知识就可以快速完成Web开发。

本书理论与实践相结合,旨在帮助读者更好地了解数据科学实践的方法和技巧。推荐广大的 R 语言爱好者和学习者阅读和学习此书!

END.

来源 :R语言中文社区

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档