首页
学习
活动
专区
工具
TVP
发布

数据小魔方

专栏作者
471
文章
1022446
阅读量
142
订阅数
ggplot2学习笔记之——ggplot2主题调整系统
ggplot2绘图系统拥有庞大、健全的图形美化系统,这一套图形美化依赖于图例调整系统、标度调整系统、标签调整系统、主题调整系统以及分面系统。 本节仅从主题调整系统来浅析ggplot2是如何实现脱离数据层面的信息,单独实现主题调整系统的。 从大的层面上来说,ggplot2的主题系统知识主要分为三个层面: 一、主题调整函数: 二、元素调整函数: 三、元素调整参数: 主题调整函数很好理解,就是用于封装主题的函数,可以是预设主题(系统默认的主题函数)、也可以是第三方接口包提供的定制主题(如ggthemes包、ggt
数据小磨坊
2018-04-16
1.1K0
R语言学习笔记之——数据处理神器data.table
数据处理在数据分析流程中的地位相信大家都有目共睹,也是每一个数据从业者面临的最为繁重的工作任务。 在实际应用场景下,虽然SQL(SQL类专业的etl语言)是数据处理的首选明星语言,性能佳、效率高、容易培养数据思维,但是SQL没法处理构建全流程的数据任务,之后仍然需要借助其他数据分析工具来对接更为深入的分析任务。 R语言作为专业的统计计算语言,数据处理是其一大特色功能,事实上每一个处理任务在R语言中都有着不止一套解决方案(这通常也是初学者在入门R语言时,感觉内容太多无从下手的原因),当然这些不同方案确实存在
数据小磨坊
2018-04-12
3.5K0
一款脑洞大开的表格可视化神器
今天跟大家介绍一款任坤大神写的新包——formattable。 这个包的功能很简单,但是却很具创意性,它颠覆了R语言data.frame数据表的呈现方式,允许在表格内自定义视觉化元素,比如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。 关于数据框的呈现方式,R语言内目前较好的自定义呈现方式是谢益辉大神的DT包,可以 将静态表格动态化,进行切片、索引、排序操作。 devtools::install_github("renkun-ken/form
数据小磨坊
2018-04-12
1.6K0
MySQL基础入门系列之——字符与日期数据处理
今天这一篇分享MySQL中的字符串处理工具与日期时间处理,这一部分内容虽然看似不多,但是往往是输出处理中的的痛点。 我的MySQL数据库中已经建好了一个包含两列日期与一列薪资范围字段。(深感通过R或者
数据小磨坊
2018-04-12
1.3K0
左手用R右手Python系列14——日期与时间处理
日期与时间格式数据处理通常在数据过程中要相对复杂一些,因为其不仅涉及到不同国家表示方式的差异,本身结构也较为复杂,在R语言和Python中,存在着不止一套方法来处理日期与时间,因而做一个清洗的梳理与对比将会很有价值。 本文针对R语言与Python中常用日期与时间函数进行简要对比介绍,力求简单明了,覆盖常用的处理方法。 R 在R语言中,涉及到日期与时间处理的函数主要有以下四套: as.Date()函数: POSIXt/POSIXct函数: chron包: lubridate包: 前两个是R语言的base包
数据小磨坊
2018-04-11
2.2K0
左右用R右手Python系列——字符串格式化输出
学习Python不到一个月,虽然学的很渣,但是还是想通过这种途径分享自己的学习心得,毕竟当初学习R语言也是这么走过来的。 今天是R语言与Python综合系列的第一篇,就聊一聊两者在常用字符串输出上的差异。 为了方便统一案例图片的风格,今天统一在jupyter编辑器中编辑(R和Python)。 通常在R语言中我们使用最多的关于字符串输出函数是paste和paste0。 这两着之间的差别非常微小,如同其字面意思一样,前者可以自定义字符串间隔符号,后者则默认没有间隔符号。 paste和paste0都可以完成单个向
数据小磨坊
2018-04-11
1.5K0
左手用R右手Python系列——数据合并与追加
今天这篇跟大家介绍R语言与Python数据处理中的第二个小知识点——数据合并与追加。 针对数据合并与追加,R与Python中都有对应的函数可以快速完成需求,根据合并与追加的使用场景,这里我将本文内容分成三部分: 数据合并(简单合并,无需匹配) 数据合并(匹配合并) 数据追加 数据合并(简单合并,无需匹配) 针对简单合并而言,在R语言中主要通过以下两个函数来实现: cbind() dplyr::bind_cols() df1 <- data.frame(A=c('A0', 'A1', 'A2', 'A3'),
数据小磨坊
2018-04-11
1.7K0
让执着成为一种习惯——仿网易数独玫瑰气泡图
没有难学的技艺,只有不够辛勤的付出! 今天这篇文章推送仿的的是网易数独的一幅信息图,内容呈现的是全球各国人民对于养老所持的态度,数据来源于Pew Reserch Centre。 图表整体难度中等,使用
数据小磨坊
2018-04-11
9920
当PowerBI遇到R语言
PowerBI作为微软系最新的商务智能办公系统,自去年发布以来,一直都备受瞩目。 他的更新频次相当之高,功能更新迭代非常迅速。 大概对可视化领域稍有涉猎的朋友们,都明白其中缘由,大数据与云计算的趋势席卷全球,海量数据处理成为了限制各行业发展的掣肘。而受制于编程工具的门槛,大部分数据处理业务人员,可能要严重依赖Excel以及其他无需编程的可视化自助操作软件。 以上需求也称为自助式BI工具,也就是无需IT人员主导的、业务人员可自行操作的商务智能工具。 而目前这个领域,Tableau的成功商业化使其已经赢得先机,
数据小磨坊
2018-04-11
1.9K0
R语言数据处理——数据合并与追加
数据结构的塑造是数据可视化前重要的一环,虽说本公众号重心在于数据可视化,可是涉及到一些至关重要的数据整合技巧,还是有必要跟大家分享一下的。 在可视化前的数据处理技巧中,导入导出、长宽转换已经跟大家详细的介绍过了。 今天跟大大家分享数据集的合并与追加,并且这里根据所依赖函数的处理效率,给出诺干套解决方案。 数据合并操作涉及以下几个问题: 横向合并; 1. 是否需要匹配字段 1.1 匹配字段合并 1.1.1 主字段同名 1.1.2 主字段不同名 1.2 无需匹配字段合并 纵向合并:(情况比较简单,列
数据小磨坊
2018-04-11
4.6K0
sparklines迷你图系列16——Distribution(Spread)
今天跟大家分享sparklines迷你图系列16——Distribution(Spread)。 这种图表用中文翻译是在费解,没有特别合适的叫法,但是实际上它是一种用于展示数值型变量分布形态的图表(很类
数据小磨坊
2018-04-11
6180
sparklines迷你图系列15——Composition(BoxPlot)
今天要跟大家分享的是sparklines迷你图系列14——BoxPlot。 箱线图是用于呈现数据分布形态(功能类似直方图)的一种图表,对于连续型数据,箱线图可以展现数据分布的极差、中值以及各个分位数,
数据小磨坊
2018-04-11
6780
sparklines迷你图系列14——Correlation(HeatMap)
今天跟大家分享的是sparklines迷你图系列13——Correlation(HeatMap)。 热力图在excel中可以轻松的通过自带的条件格式配合单元格数字来完成。 但是在sparklines迷
数据小磨坊
2018-04-11
1.1K0
迷你图工具汇总~
自小魔方的公众号开通以来,陆陆续续、啰里啰嗦的分享了很多技巧,但是一直觉得很杂乱,缺乏体系,所以以后有必要定期对各系列分享内容进行阶段性总结。 最近一个系列一直在围绕sparklines这款迷你图插件在写,当然限于时间和精力,只能跟着官方的指导文档和操作案例进行,没有对于各类图表的使用场景进行详尽的描述。 我很喜欢用迷你图来表达数据,(当然不是所有的图表类型都适合使用迷你图表达)因为这样做出来的图表显得灵气十足、清新简洁。(主要是可以利用excel单元格这一纯天然的排版利器) 特别是sparklines迷你
数据小磨坊
2018-04-11
1.6K0
R语言笔记之——常用数据导入方式简介
因为之前旁听过几节R语言的课程,再加上自己练习数据可视化的需要(特别是可视化包——“ggplot2”),学了些R语言的皮毛。 总觉得基础没打牢,好高骛远、急于求成,总想学高大上的模块,却又总是力不从心。 现在的状态是,参考别人的代码,修修补补,勉强能画一些图,做一些计算,可是自己写起来却总是磕磕碰碰,漏洞百出。 深感基础语法之重要性,这里分享一些学习过程中总结的笔记,希望初学者可以牢记于心,避免同样的问题。 R语言支持的数据类型很多,但是初学者能接触到却寥寥无几,这里仅仅介绍.TXT、.CSV、直接复制三种
数据小磨坊
2018-04-11
1.2K0
sparklines迷你图系列9——Composition(Pareto)
今天继续跟大家分享sparklines迷你图系列9——Composition中的Pareto。 其实就是在很久以前分享过的帕累托图,当时分享的时候是通过一个柱形图+折线图(柱形图是按照指标大小从左至右
数据小磨坊
2018-04-11
5220
sparklines迷你图系列12——Composition(Pie)
今天分享sparklines迷你图系列13——Composition(Pie)。 大家看到名字就肯定知道是饼图了。借助sparklines迷你图工具,我们可以通过特殊的函数语法,做出袖珍型的,装在单元
数据小磨坊
2018-04-11
7620
sparklines迷你图系列8——Comparision(HVar & VBar)
今天继续跟大家分享sparklines迷你图系列8——Comparision图表类型中的单条形图/柱形图。 这里所指的条形图之所以称为单条形图、柱形图,是因为每一个数据条或者柱子都是单独存放在一个单元
数据小磨坊
2018-04-11
5600
sparklines迷你图系列7——Comparision(+/-Variance)。
今天跟大家分享sparklines迷你图系列的第七篇——Comparision(+/-Variance)。 该图表用于表现指标增长率波动情况,波动范围-100%~100%之间。通过方向及填充颜色来区分
数据小磨坊
2018-04-11
5500
sparklines迷你图系列6——Comparison(Columns)
今天分享sparklines迷你图中的Comparision图表类型中的Columns图表。 该图表说到底其实就是我们日常工作中最常用到的柱形图。 该图表的函数参数较多,一共有15个之多,但是很多元素
数据小磨坊
2018-04-11
6230
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档