首页
学习
活动
专区
工具
TVP
发布

数据小魔方

专栏作者
471
文章
1039527
阅读量
142
订阅数
【直播回顾】轻松入门数据可视化
直播回看地址 https://appqtulvsie4217.pc.xiaoe-tech.com/detail/l_5e5dd4cfd2ef3_4Ramdutd/4?fromH5=true#/ 数据可
数据小磨坊
2020-09-27
1.7K0
用编程赋能工作系列——地理围栏的基本操作运算
接着上一篇的地图系列相关知识,本篇给大家介绍一种局部空间分析的地理围栏运算,具体场景主要用在分析局部的商圈、商场、街道、步行街内部相关变量方面。
数据小磨坊
2020-03-06
2.7K1
用编程赋能工作系列——高德地图开发
作为菜鸟分析师一枚,日常工作中需要处理大量地理位置相关(如城市、辖区、街道、商场、楼宇等)数据。分析报告中总是用吐了的柱形图、条形图,不仅自己看着辣眼睛,老板也审美疲劳。
数据小磨坊
2020-02-25
1.2K0
用编程赋能工作系列——解锁合并单元格问题
能把学习的编程技能用在实际工作中,提升效率、解决痛点、释放生产力,个人觉得是学习编程技能ROI最高的回报,而非都要挤破头成为数据科学家、算法工程师,毕竟这些职业的门槛一直都在,但让工作更轻松却是任何一个职业都有的真实诉求。
数据小磨坊
2020-02-25
6880
Python:动态全国各省新型冠状病毒疫情变化
在家闲来无事,就用python绘制了全国各省新型冠状病毒疫情状况动态图表,其地图数据来源于腾讯的疫情实时追踪展示地图:https://github.com/dongli/china-shapefiles
数据小磨坊
2020-02-25
1.3K0
Python中的魔法函数——Counter
Python的标准库collections中有很多魔法函数,可以使平时的数据处理非常高效,今天介绍一个很好用的计数函数——Counter。
数据小磨坊
2019-05-06
2.6K0
Python可视化笔记之folium交互地图
leftlet给R语言提供了很好用的交互式动态地图接口,其在Python中得API接口包名为folium(不知道包作者为何这样起名字,和leaflet已经扯不上关系了),可以满足我们平时常用的热力图、填充地图、路径图、散点标记等高频可视化场景。
数据小磨坊
2018-07-25
2.8K0
使用Python中的folium包创建热力密度图
最近探索出来一个在Python中创建热力图非常高效的方法,使用folium包来创建热力图,实际效果非常赞,过程简单,代码量少。
数据小磨坊
2018-07-25
4.7K0
左手用R右手Python系列之——字符串格式化进阶
关于R语言字符串格式化之前无论是专题还是案例教程中均有所涉及,今日这一篇之所以重提是因为又找到了一个很好用的字符串格式化包。 这个包的语法源于Python风格,这样可以让那些从Python迁移过来的R语言学习者无需额外的记忆负担,即可平稳掌握R语言中的字符串格式化语法。 提到字符串格式化语法,我们一定能想到paste/pasteo函数,或者str_c函数,这两个函数的用法差不多,都是通过字符串与变量之间的拼接完成字符串格式化任务,但是问题是R语言中的字符处理并不想Python中那么灵活(仅靠“+”即可拼接字
数据小磨坊
2018-04-12
1.1K0
R语言学习笔记——R语言面向对象编程系列2
最近在看任坤大神的新作——《R语言编程指南》,其中对于编程语言中非常流行的面向对象编程范式(OOP)在R语言中的实现进行了非常详尽的讲解,强烈推荐各位有志于进阶R语言编程的小伙伴儿进行阅读。 R语言内目前可以实现OOP范式的一共有四套标准:S3、S4、RC、R6,其中关于S3、S4两种范式在早期的各种扩展包中使用比较多,是基于泛型函数而实现的,之前在学习Python的面向对象编程系列时曾经做过粗浅的练习: 左手用R右手Python系列——面向对象编程基础 S3与S4之间的差异: 1.在定义S3类的时候,没
数据小磨坊
2018-04-12
1.8K0
MySQL基础入门系列之——字符与日期数据处理
今天这一篇分享MySQL中的字符串处理工具与日期时间处理,这一部分内容虽然看似不多,但是往往是输出处理中的的痛点。 我的MySQL数据库中已经建好了一个包含两列日期与一列薪资范围字段。(深感通过R或者
数据小磨坊
2018-04-12
1.3K0
MySQL基础入门——MySQL与R语言、Python交互
MySQL作为z最为流行的关系型数据库管理平台之一,与绝大多数数据分析工具或者编程语言都有接口,今天这一篇分享如何将MySQL与R语言、Python进行连接。 R语言中与SQL管理平台通讯的接口包有很多,可以根据自己使用的数据库平台类型以及习惯,挑选合适的接口包。因为我个人笔记本使用的MySQL平台,所以本篇仅以MySQL为例分享。(如果你需要其他平台的接口导入方案,可以直接在csdn博客上搜关键字,有很多博客资料可以参考)。 我习惯使用的接口包是RMySQL,里面的核心函数主要涉及数据库连接,数据读写,
数据小磨坊
2018-04-12
1.3K0
左手用R右手Python系列——使用多进程进行任务处理
数据抓取中的密集任务处理,往往会涉及到性能瓶颈,这时候如果能有多进程的工具来进行支持,那么往往效率会提升很多。 今天这一篇分享在R语言、Python中使用调用多进程功能进行二进制文件下载。 导入待下载的文件: library("dplyr") mydata<-read.csv("D:/Python/File/toutiaoreport.csv",stringsAsFactors = FALSE,check.names = FALSE) 抽取报告的url和报告名称: mydata1<-mydata[1:10
数据小磨坊
2018-04-12
1K0
左手用R右手Python系列——多进程/线程数据抓取与网页请求
这一篇涉及到如何在网页请求环节使用多进程任务处理功能,因为网页请求涉及到两个重要问题:一是多进程的并发操作会面临更大的反爬风险,所以面临更严峻的反爬风险,二是抓取网页数据需要获取返回值,而且这些返回值需要汇集成一个关系表(数据框)(区别于上一篇中的二进制文件下载,文件下载仅仅执行语句块命令即可,无需收集返回值)。 R语言使用RCurl+XML,Python使用urllib+lxml。 library("RCurl") library("XML") library("magrittr") 方案1——自建显式循
数据小磨坊
2018-04-12
8530
左手用R右手Python系列——面向对象编程基础
面向对象编程是程序设计中一种重要且高效的编程规范,它区别于常见的面向过程编程。在R语言以及Python的程序包开发过程中,大量使用了面向对象的编程范式。 百度百科关于面向对象编程的权威解释是: 面向对象程序设计(英语:Object-oriented programming,缩写:OOP)是一种程序设计范型,同时也是一种程序开发的方法。其最重要的三大特征是封装、继承、多态。 对象指的是类的实例。它将对象作为程序的基本单元,将程序和数据封装其中,以提高软件的重用性、灵活性和扩展性。 R语言中的面向对象编程是通
数据小磨坊
2018-04-12
1.2K0
左手用R右手Python系列——百度地图API调用与地址解析/逆解析
地理位置信息的解析与逆解析可能是我们在分析地理位置数据时所面临的最棘手的问题了,好在现在很多主流的在线 地图厂商地给开发者提供了免费的API接口调用。 这一篇以百度地图API为例,演示如何在R语言以及Python中通过调用API实现地理位置的解析与逆解析,即将地址转换为具体经纬度,将经纬度转换为具体的地址。 免费API调用需要开发者自己在百度地图开放平台上注册APPkey,每日限调6000次,因为是免费的,所有人都可以申请注册,注册地址如下。 http://lbsyun.baidu.com/apiconso
数据小磨坊
2018-04-12
1.7K0
左手用R右手Python系列之——json序列化与反序列化
json格式数据作为如今越来越流行的数据交换格式,几乎已经成为web端数据交互的标准,主流的数据科学语言R,Python都中都有非常完善的半结构化数据与json数据进行通讯。本篇文章将会通过简单案例介绍R语言与Python中与json数据进行序列化与反序列化的常用函数。 json的数据以键值对形式存在,在R语言中,符合此标准的就是基础数据对象中的list(严格来说,R语言中所有数据对象都可以表示为list,但是可以保存递归结构只有list一种)。 在R语言中,涉及到json数据处理的,主要是list转换为
数据小磨坊
2018-04-12
1.7K0
左手用R右手Python系列之——迭代器与迭代对象
接触过Python的小伙伴儿肯定都知道,Python中关于迭代器和可迭代对象运用的很广泛。迭代器可以以一种非常友好的方式使用在循环中,不仅节省内存,还能优化代码。 在R语言中,其实也有迭代的概念,但是需要借助第三方包的辅助。 今天要介绍的包是iterators和itertools,这两个包在最新开发的软件包工具中使用的非常频繁。迭代器作为一种特殊的容器,生成之后,只能按照顺序迭代完内部对象之后,便失效了,要想重新迭代就必须重新生成一个迭代器。 而我们在普通场景下构造的循环,一般都利用R语言内部的现有的数据结
数据小磨坊
2018-04-12
1.3K0
左手用R右手Python系列之——数据框与apply向量运算
R语言与Python中的apply函数都有着丰富的应用场景,恰到好处的使用apply函数,可以避免在很多场景下书写冗余的代码,这不仅能提高代码可读性,而且提高代码执行的效率。 apply(X, MARGIN, FUN, ...) X #一个数组(包括矩阵) MARGIN #一个给定下标的向量,将被指定函数执行计算1代表行,2代表列,c(1,2)代表行列。 FUN #执行计算的函数(如果是+、%*%这种符号函数需要使用反引号包括【英文输入法状态下的“~”键】) ... #
数据小磨坊
2018-04-12
1.9K0
左手用R右手Python系列之——noSQL基础与mongodb入门
12月的第一天,祝所有小伙伴儿的12月都能够被温柔以待。 能在学校悠哉写推送的日子所剩不多了,为了珍惜剩下所剩不多的推送机会,打算12月写一些实践性强一些的内容,比如数据库(包括关系型的和noSQL)。 前段时间一直在探索数据抓取的内容,那么现在问题来了,抓完数据如何存储呢? 保存成本地文件是一种方案,但是借助关系型数据库或者noSQL数据库,我们可以给自己获取的数据提供一个更为理想的安身之所。 今天这一篇粗浅的聊一聊非结构化数据存储,以及R语言和Python与mongoDB之间的通讯。 写这一篇是因为之
数据小磨坊
2018-04-12
3.6K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档