专栏首页数据小魔方云课堂Excel课程数据可视化分析

云课堂Excel课程数据可视化分析

我一直是网易云课堂的重度用户,从大二开始就一直在上面学习各种技能类课程,作为互联网在线教育的知名品牌,云课堂在某种程度上弥补了我们从校园到职场过渡过程中,很多技能类知识不足的缺口。

今天这一篇是接着上一篇云课堂Excel课程板块爬虫数据进行多角度的可视化分析,上次的爬虫一共爬取了425条课程信息,一共提取了9个字段。

英文字段名称 中文含义 类型

productId 课程ID 定性

productName 课程名称 定性

lectorName 教师名称 定性

provider 发布机构 定性

learnerCount 学习人数 数值

discountPrice 折扣价 数值

discountRate 折扣率 数值

originalPrice 原始价格 数值

score 评分 数值

scoreLevel 评分等级 数值

description 课程描述 定性

以上是本次爬取的字段描述,按照这些字段属性,结合我个人的需求以及云课堂的课程评价体系,我将本次分析的目标及思路梳理如下:

课程来源分析

  • 课程来源
  • 作者贡献数

课程内容分析

  • 高频技能需求

课程价格分析

  • 折扣率分析
  • 均价

课程知名度分析

  • 用户数分析

课程口碑分析

  • 评分分析

根据以上几个模块,我们开始今天的可视化分析之旅!


首先分析课程数量分析,我感兴趣的是在这425门Excel在线课程中,哪些作者发布课程频率最高,排在最前列的分别是那些机构或者个人,在所有作者中,多少是机构名义讲课,多少是以个人名义讲课。

课程来源分析

以下是云课堂Excel课程模块的高频课程作者统计:

排在前五位的老师是刘万祥老师、杨文星老师、Excel报表顾问、肖邦主、远目教育。前十名老师中,也能看到一些耳熟能详的名字:在PowerBI领域颇有建树的刘凯老师、秦川老师和小蚊子数据分析以及PowerPivot工坊的赵文超老师。

其中刘万祥老师在一共发布了17门课,夺得Excel板块最勤奋讲师桂冠,刘老师的多产与勤奋实在让人佩服。

前十位位作者中,有7位老师的课程发布量都在10门以上,从课程发布频数的累计分布图中可以看到,累计频数分布图走势先陡峭后平缓,这反映了什么呢,说明课程资源的集中程度很高,想想前十位作者大部分都发布了10门以上的课程。

我按照五门课程的分割点对课程作者进行了切分,结果发现,有29名老师曾发布过5门以上的课程,占比21.64%,发布课程不足5门的老师一共105人,占比78.36%。

其中发布过5门以上课程的老师发布课程总计为242门,占总课程比率57.21%,发布课程不足五门的老师累计发布了181门课程,占比42.79%。这进一步验证了上面的结论,即Excel板块的课程来源集中度很高,将近20%的高频作者贡献了将近60%的课程资源。

按照课程发布作者和机构分类,以个人名义发布课程的作者一共271人,占比63.8%,而以机构名义发布课程的作者仅占36%左右。

这个说明什么呢,说明在当今网络无处不在的时代,个体的崛起以及个人品牌的塑造,已经渗透到互联网在线教育行业。真正掌握资源和技能的个体,完全可以依靠互联网完成技能输出和品牌塑造。

课程内容分析

关于课程内容方面,我的原始数据中仅有课程名称和课程描述涉及到课程内容,暂时想不到很好地内容分析方法,课程描述的文本非常杂乱,使用文本分词暂时个人还处理不好(哪位文本分析的大神感兴趣可以来挑战下),这里仅就课程名称词频做一下简要分析:

library("wordcloud2") library("ggplot2")

mydata<-read.csv("E:/微信公众号/公众号——数据小魔方/2017年9月/20170918/Excel技能需求频率统计.csv",stringsAsFactors = FALSE,check.names = FALSE) library(wordcloud2) wordcloud2(mydata, size = 1, fontFamily = "微软雅黑",minRotation = -pi/6, maxRotation = -pi/6,rotateRatio = 1)

ggplot(mydata[1:10,],aes(reorder(x,Freq),Freq))+ geom_bar(stat="identity",fill="#B1DB85")+ geom_text(aes(label=Freq))+ coord_flip()+ ggtitle("Excel课程高频需求技能频率分布")+ theme_void(base_size=25)%+replace% theme(axis.text=element_text(size=15))

从分词结果上来看,函数、VBA、图表、数据透视表、数据处理需求占了巨大部分词频,函数高居榜首,高达32次,VBA、图表、数据透视表、数据处理则各有千秋,相差不大。

而PowerBI、PowerPivot、PowerQuery、动态图表、信息图表等需求也很强劲。由此可见,商务智能工具PowerBI的问世,给商务场景下业务需求带来了巨大便利的同时,也激发了新的技能学习需求。

即将进入职场的小白领们一定要注意了,传统的函数、透视表、图表技能固然重要,及时关注商务智能工具也将是今后让你独具优势、弯道超车的潜在路径。

课程价格分析

在所有课程中,有354门付费课程,占课程总数的83.29%,其中付费课程中有折扣优惠的课程有185门,占所有付费课程的比重为43.53%,平均折扣率为55%。

免费课程的平均学习人数为27000人,付费课程的平均学习人数为270,天哪这个数字太巧合了,刚好相差100倍。

还是提醒广大Excel在线学习者,不要只顾着课程价格就盲目的去选择课程,不要抱着一种占便宜的心态,无论免费还是付费,你的时间都是无价的,学了对你没有任何用处的免费课程,浪费的是你自己的宝贵时间。倘若你想入门,可以谨慎选择那些与自己技能需求匹配的课程,倘若想要进阶或者在某一个领域深入学习,付费课程是难免的,为知识付费是一种很值得骄傲的事情。

我详细统计了付费课程价格TOP20的折扣率变化、课程类型以及最具价值课程作者信息。

结果呈现如上,在12门最具价值的课程中,刘万祥老师一个人包揽了7个,其中最为知名的课程要属《向经济学人学图表》《向华尔街日报学图表》系列课程,这些系列我个人都买过,确实不错,刘老师在商务图表领域的积淀有目共睹,其核心实力也得到了市场的检验以及大家的认可。

课程知名度分析

对于课程知名度的分析,主要基于学习者数量这个指标,我简略统计了以下所有免费课程和付费课程的学员数量排名。

在最受学员欢迎的付费课程TOP20中,秋叶老师的和秋叶一起学习Excel独占鳌头,学员人数高达14419,当然考虑到秋叶老师是团队化运作,而这里没有区分个人和机构,所以仅从学员人数规模评价受欢迎程度可能有失偏颇,仅供参考。

这里还有一个很有趣的现象是在最受欢迎的TOP20课程中,同样有作者一人包揽多门课程的情况,刘万祥老师和PowerPivot工坊的赵文超老师分别占据了4门课程,令人包揽最受欢迎的TOP20中的40%,秋叶老师团队和李则见老师分别占据两门课程。在所有TOP20课程中,学员人数均在1000以上,可以说真正有颜有料有干货的课程,还是能够吸引大家的兴趣的。

课程口碑分析

从课程口碑分析中,网易云课堂课程评价实行的5分制,区分度并不是很高。

不过从得到大于4.9分的近22个课程分布来看,刘万祥老师仍然牢牢把握着Excel高品质高口碑课程的头把交椅,一共占了7席4.9分高质量课程,累计评分树状图分布显示,刘万祥老师总分58.1,排名前五的分别是刘万祥、肖邦主、上海职领网络科技、刘凯老师、第五位(未知),第六位PowerPivot工坊的赵文超老师也表现出色。

以上便是本次云课堂爬虫数据分析的全部,由于对在线教育行业了解并不是十分深入,特别是指标构建,分析角度、可视化逻辑上有诸多不成熟之处,还望各位数据分析行业前辈高人多多指点。

最后感谢网易公司对中国在线教育行业的贡献,相信凭着丁磊先生的个人远见和网易公司的社会责任感,网易云课堂可以为中国在线教育行业提供更多优质学习资源。

Excel课程选择与学习建议:

(个人建议,仅供参考,并不代表云课堂官方排名)

商务图表类:

  • 刘万祥ExcelPro

透视表与函数:

  • 肖邦主

商务智能工具类:

  • 刘凯
  • 赵文超

以上分析和建议仅供各位想要在职场充电的Excel学习者参考,因为数据爬取无法保证客观,因而结论无法保证客观公允,请大家谨慎参考。

本文分享自微信公众号 - 数据小魔方(datamofang),作者:杜雨

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 你绝对想不到,数据地图还能这么玩~

    这个周末刷微信的时候,偶然看到一篇关于R语言12月更新包的介绍,翻到底部看了一眼,刚好看到一个关于ggplot2的一个图层插件——geom_scatterpie...

    数据小磨坊
  • Xcelsius(水晶易表)系列10——选择器高级用法(钻取与动态可见性)

    今天要跟大家分享的专题是水晶易表选择器的高级用法——向下钻取与动态可见性。 本案例紧接系列6——熟练统计图中的钻取功能一篇,不同的是这里通过开启标签菜单的动态可...

    数据小磨坊
  • 数据透视图|切片器与日程表

    今天教大家使用excel中的数据透视图——切片器与日程表! excel自2010版之后,加入了切片器与日程表功能,这两个小功能是数据筛选的利器,但是只能在数据透...

    数据小磨坊
  • 【实战】手把手教你数据分析实操--以在线教育为例!

    数据来源于kaggle上关于2012-2016年Harvard and MIT两校在edX开设在线课程情况的研究。该数据集中共有290个在线课程的数据,字段信息...

    1480
  • GitHub 官方推荐的 20 个免费教程(上)

    GitHub 官方在去年发布过一篇文章,总结了 GitHub 上最受欢迎的 20 个课程仓库。

    GitHubDaily
  • 优质数据科学课程推荐:总结篇

    原作者   David Venturi 编译 CDA 编译团队 本文为  CDA 数据分析师原创作品,转载需授权 一年以前,我还只是一个没有任何编程经验的技术宅...

    CDA数据分析师
  • GitHub 官方推荐的 20 个免费教程(下)

    GitHub 官方在去年发布过一篇文章,总结了 GitHub 上最受欢迎的 20 个课程仓库。

    GitHubDaily
  • 如何改进机器人类专业课直播和云实践课程的质量?

    近期一直通过网络授课,心怀愧疚与感恩。愧疚是因为上课准备不足,效果不好;感恩是因为学生一直包容和鼓励。

    zhangrelay
  • 斯坦福大学《机器学习》课程-中文版内容(9.7)

    吴恩达老师的《machine learning》是目前最受欢迎的一门机器学习课程,在coursera/ youtube等平台上的点击量高居榜首。

    AI传送门
  • 斯坦福大学《机器学习》课程-中文版内容(9.6)

    吴恩达老师的《machine learning》是目前最受欢迎的一门机器学习课程,在coursera/ youtube等平台上的点击量高居榜首。

    AI传送门

扫码关注云+社区

领取腾讯云代金券