首页
学习
活动
专区
工具
TVP
发布

数据小魔方

专栏成员
471
文章
1083637
阅读量
142
订阅数
EasyShu【2.4】升级版-ECharts地图一键绘制
【推广】:欢迎加入EasyShu交流微信群,参加我们EasyShu插件的推广,有福利哦!
数据小磨坊
2020-09-27
2.7K1
【直播回顾】轻松入门数据可视化
直播回看地址 https://appqtulvsie4217.pc.xiaoe-tech.com/detail/l_5e5dd4cfd2ef3_4Ramdutd/4?fromH5=true#/ 数据可
数据小磨坊
2020-09-27
1.7K0
R语言数据分析笔记——Cohort 存留分析
相信经常做数据分析的同学都听说过Cohort 分析,特别是互联网运营中,用于分析客户存留等场景,以往这种分析大都借助SQL+Excel完成。
数据小磨坊
2018-07-25
1.3K0
R语言学习笔记之——数据处理神器data.table
数据处理在数据分析流程中的地位相信大家都有目共睹,也是每一个数据从业者面临的最为繁重的工作任务。 在实际应用场景下,虽然SQL(SQL类专业的etl语言)是数据处理的首选明星语言,性能佳、效率高、容易培养数据思维,但是SQL没法处理构建全流程的数据任务,之后仍然需要借助其他数据分析工具来对接更为深入的分析任务。 R语言作为专业的统计计算语言,数据处理是其一大特色功能,事实上每一个处理任务在R语言中都有着不止一套解决方案(这通常也是初学者在入门R语言时,感觉内容太多无从下手的原因),当然这些不同方案确实存在
数据小磨坊
2018-04-12
3.6K0
一款脑洞大开的表格可视化神器
今天跟大家介绍一款任坤大神写的新包——formattable。 这个包的功能很简单,但是却很具创意性,它颠覆了R语言data.frame数据表的呈现方式,允许在表格内自定义视觉化元素,比如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。 关于数据框的呈现方式,R语言内目前较好的自定义呈现方式是谢益辉大神的DT包,可以 将静态表格动态化,进行切片、索引、排序操作。 devtools::install_github("renkun-ken/form
数据小磨坊
2018-04-12
1.6K0
MySQL基础入门——MySQL与R语言、Python交互
MySQL作为z最为流行的关系型数据库管理平台之一,与绝大多数数据分析工具或者编程语言都有接口,今天这一篇分享如何将MySQL与R语言、Python进行连接。 R语言中与SQL管理平台通讯的接口包有很多,可以根据自己使用的数据库平台类型以及习惯,挑选合适的接口包。因为我个人笔记本使用的MySQL平台,所以本篇仅以MySQL为例分享。(如果你需要其他平台的接口导入方案,可以直接在csdn博客上搜关键字,有很多博客资料可以参考)。 我习惯使用的接口包是RMySQL,里面的核心函数主要涉及数据库连接,数据读写,
数据小磨坊
2018-04-12
1.3K0
左手用R右手Python系列——七周数据分析师学习笔记R语言、Python版
上一篇我重点写了秦路老师在七周数据分析师系列课程中MySQL模块的实战作业SQL语法,对比了自己的冗余思路与老师的最佳思路。 MySQL入门学习笔记——七周数据分析师实战作业 这一篇,仍然是相同的六个业务问题,我尝试着R语言、Python复盘一遍,这样你可以对比同样的业务逻辑,使用不同工具处理之间的效率、逻辑的差异,以及各自的优缺点。在R语言代码部分,适当位置酌情做了注释,Python部分未做注释,请谨慎参考! 首先大致介绍这两份数据: userinfo 客户信息表 userId 客户id ge
数据小磨坊
2018-04-12
1.5K0
MySQL入门学习笔记——七周数据分析师实战作业
本篇推送主要涉及SQL语言中较为复杂的子查询与函数嵌套。 虽然这个MySQL系列取名为MySQL基础入门,但是个人不打算做单个函数的用法总结,或者说简单罗列,(这些内容你可以通过很多途径了解)因为一方面以前有过SQL基础方面的学习经历(本科的计算机必修课以及计算机等级考试)现在应该更加深入一些,另一方面SQL是一门数据分析语言,单纯的一个两个函数基本很少能解决问题。 SQL语言不像R语言和Python那种面向对象的语言,提供了各种灵活多变的的可用方法以及成千上万的高效解决工具,更没有提供像管道函数那样的参
数据小磨坊
2018-04-12
1.8K0
扒一扒rvest的前世今生!
rvest包可能是R语言中数据抓取使用频率最高的包了,它的知名度和曝光度在知乎的数据分析相关帖子和回答中都很高。 甚至很多爬虫教程和数据分析课程在讲解R语言网络数据抓取时,也大多以该包为主。 坦白的说,rvest的确是一个很好地数据抓取工具,不过他的强项更多在于网页解析,这一点儿之前就有说到。 你可能惊艳于rvest强大的解析能力,有两套解析语法可选(Xpath、css),短短几个关键词路径就可以提取出来很重要的数据。 但肯定也遇到过有些网页明明数据就摆在那里,通过Chrome开发者工具(或者selecto
数据小磨坊
2018-04-11
2.7K0
R语言爬虫实战——网易云课堂数据分析课程板块数据爬取
R语言的爬虫生态虽然与Python相比要弱小很多,but,如果你真的想要用R干一些有趣的事情,那么R语言目前所具有的的网络爬取工具也能给你带来很多方便。 今天借着中秋节的兴致,用网易云课堂 全部课程>编程开发>人工智能与大数据>数据分析 模块的课程作为实战对象,来给大家演练一下如何使用R语言httr包实现异步加载和POST 表单提交以及cookies登入。 直接使用json或者其他格式的表单返回值,避免苦逼的的书写大量正则表达式以及让人眼花缭乱的 CSS表达式、Xath路径表达式。这应该是每一个爬虫练
数据小磨坊
2018-04-11
1.6K0
左手用R右手Python系列10——统计描述与列联分析
数据统计描述与列联表分析是数据分析人员需要掌握的基础核心技能,R语言与Python作为优秀的数据分析工具,在数值型数据的描述,类别型变量的交叉分析方面,提供了诸多备选方法。 这里根据我们平时对于数据结构的分类习惯,按照数值型和类别型变量分别给大家盘点一下R与Python中那些简单使用的分析函数。 R语言: 描述性统计:(针对数值型) library("ggplot2") myvars<-names(diamonds)[c(5,6,7)];myvars [1] "depth" "table" "price"
数据小磨坊
2018-04-11
3.4K0
仿经济学人——矩阵气泡图
本篇文章案例来源于经济学人2013年一幅关于家庭支出结构与国家间的交叉对比图。 该图信息量相当丰富,至少涵盖了四个维度的信息,支出结构信息(类别型字段)、国别信息(类别型字段)、支出水平分类(类别型字
数据小磨坊
2018-04-11
2.2K0
网易云课堂Excel课程爬虫思路
由于即将毕业,马上进入职场,想来是时候需要巩固一下基本职场技能了,特别是Excel这种杀手级职场应用。 可是如今网络这么发达,到处都充斥着Excel课程、视频、教程,真的很容易让人眼花缭乱,不知所措。 看书来的太慢了,还是直接看视频吧,简单粗暴,学习之前总要熟悉一下Excel教学行业的大致情况吧,今天就拿网易云课堂的Excel板块作为目标,在练习数据爬取的同时,顺便了解一下Excel培训行业的行情,知己知彼才能百战不殆,才能更加集中精力的学习那些精品课程。 url<-"http://study.163.c
数据小磨坊
2018-04-11
1.9K0
shiny动态仪表盘应用——中国世界自然文化遗产可视化案例
这一篇很早就想写了,一直拖到现在都没写完。 虽然最近的社交网络上娱乐新闻热点特别多,想用来做可视化分析的素材简直多到不可想象,但是我个人一向不追星,对明星热文和娱乐类的新闻兴趣不是很大。还是更愿意把自
数据小磨坊
2018-04-11
1.3K0
财经小知识——CRS风暴与全球离岸金融中心
2017年元旦,中国政府开始正式启动CRS,听起来好高端哦,但是管我屁事! 先别着急,如果你有大量的资产或者收入配置在海外,这个真的就关你的事儿了,那么具体CRS会对中国的高收入群体产生怎样的影响呢,下面就让小编来给大家讲讲! 首先告诉大家CRS是个什么鬼? CRS全称COMMON REPORTING STANDARD,中文即“共同申报准则”。2014年,亚太经合组织(OECD)发布了《金融账户涉税信息自动交换标准》,其中CRS就是标准之一(说明还有其他的标准哦),这个法案主要是通过签署国相互披露对方国家公
数据小磨坊
2018-04-11
9230
用ggplot2画了一个我也叫不上名的炫酷图表
今日心血来潮,看到一幅制作精良的图表,就想使用ggplot2代码实现,虽然不知道该怎么称呼这个图表,但是能顺利做出来也是很有成就感的! 加载数据包 library("ggplot2") library("grid") library("showtext") library("Cairo") font.add("myfont","msyh.ttc") 构造图形数据源 mydata<-data.frame( id=1:13, class=rep_len(1:4, length=13), Label=c("Eve
数据小磨坊
2018-04-11
9480
精美炫酷数据分析地图——简单几步轻松学会
本篇文章开始教大家如何使用矢量素材在Excel、PPT中自定义精美的数据分析图表。 使用矢量素材制作数据分析报告其实并不难,最常见的就是形式就是使用矢量地图制作数据地图报告了。这个需要其实涉及到的技能并不多,仅仅是一些基础的矢量素材处理与转换工作。 一、矢量素材转换: 假如说你已经获取了一份矢量地图素材(可能是SVG、AI、EPS、EMF格式的),首先需要使用AI等工具将其解散组合(通常矢量图都是编组过的),步骤如下: (如何获取请参见上一篇图文:你想要的地图素材资源,我都帮你整理好了~ ) 使用AI解组并
数据小磨坊
2018-04-11
1.9K0
图表到底应该“简单“一些还是“复杂”一些???
这个话题,其实很早就应该写一写了。 因为这个主题在数据可视化中的地位差不多相当于当今哲学至于社会科学的地位。 说白了就是涉及到数据可视化理念之争,涉及到可视化使用场景、目标与定位的问题,也意味着这是一个纷争不断、没有定论的话题。 所以这个问题话题很棘手,所以长久以来我一直在回避这个问题,想着等自己对数据可视化的理解更为深入、全面之后,再做决断。 --------- 可是最近发现了之前推送过的几个信息图里,出现了很多关于图表是不是做的太复杂了的评论,甚至有些带着质疑和讥讽的口吻直接否定了我所做图表的价值。 看
数据小磨坊
2018-04-11
1.5K0
不用编程,教你轻松搞定数据地图
这篇文章,教会大家使用菜单类工具搞定数据地图,包括数据的获取、经纬度解析、数据地图生成等三大技能。 利用Excel2016版的PowerQuery的数据爬取功能爬取网页表格; 利用XGeocoding_v2工具批评解析地址经纬度; 利用PowerBI、Tableau制作数据地图。 首先保证安装桌面版Excel2016,下载XGeocoding_v2地址解析工具,安装PowerBI、Tableau等工具,最后需要拥有一个百度地图的免费API(需自行申请)。 要爬取的网页是关于中国大学排行榜,网址:http:/
数据小磨坊
2018-04-11
2.1K0
让执着成为一种习惯——仿网易数独玫瑰气泡图
没有难学的技艺,只有不够辛勤的付出! 今天这篇文章推送仿的的是网易数独的一幅信息图,内容呈现的是全球各国人民对于养老所持的态度,数据来源于Pew Reserch Centre。 图表整体难度中等,使用
数据小磨坊
2018-04-11
1K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档