数据小魔方

456 篇文章
56 人订阅

全部文章

数据小磨坊

美团点评 · 商业分析师 (已认证)

一个敲有趣的R语言拼图工具

在10月CRAN更新的R包中,发现了一个挺有意思的R包——customLayout,听名字就很神奇。

471
数据小磨坊

美团点评 · 商业分析师 (已认证)

机器学习笔记——哑变量处理

在机器学习的特征处理环节,免不了需要用到类别型特征,这类特征进入模型的方式与一般数值型变量有所不同。

1293
数据小磨坊

美团点评 · 商业分析师 (已认证)

机器学习笔记——特征标准化

数据标准化是为了消除不同指标量纲的影响,方便指标之间的可比性,量纲差异会影响某些模型中距离计算的结果。

833
数据小磨坊

美团点评 · 商业分析师 (已认证)

机器学习笔记——数据集分割

在模型训练之前,要首先划分训练集与测试集,如何对原始数据集进行训练集与测试集的划分?训练集与测试集的比例各占多少?如何保证各自内部标签分布平衡都会影响模型训练的...

693
数据小磨坊

美团点评 · 商业分析师 (已认证)

Julia语言初体验

最近MIT发布的julia 1.0.0版,据传整合了C、Python、R等诸多语言特色,是数据科学领域又一把顶级利器。

5962
数据小磨坊

美团点评 · 商业分析师 (已认证)

如何处理地图投影转换

最近学习地理信息可视化总是遇到投影的麻烦,包括前段时间输出两篇关于simple features的分享中,其中没有特别处理投影的问题,老司机一看就能看出其中存在...

933
数据小磨坊

美团点评 · 商业分析师 (已认证)

批量将本地gis数据导入postgis数据库

以前在处理gis数据的时候,都是直接导入本地shp素材、本地geojson素材,本地topojson素材,自从接触postgis数据之后,深感使用规范的存储系统...

641
数据小磨坊

美团点评 · 商业分析师 (已认证)

金融数据获取的api接口

最近苹果的股价一路疯长,继周四突破万亿美元市值后,周五盘中高点、收盘价双创新高。盘中高点达208.74美元,收盘价报207.99美元,上涨0.29%,创历史收盘...

1632
数据小磨坊

美团点评 · 商业分析师 (已认证)

rmarkdown+flexdashboard制作dashboard原型

R语言作为一门统计计算和数据可视化为核心特色的工具性语言,其在可视化领域或者说数据呈现方面有着非常成熟和系统的解决方案。

933
数据小磨坊

美团点评 · 商业分析师 (已认证)

Python可视化笔记之folium交互地图

leftlet给R语言提供了很好用的交互式动态地图接口,其在Python中得API接口包名为folium(不知道包作者为何这样起名字,和leaflet已经扯不上...

1984
数据小磨坊

美团点评 · 商业分析师 (已认证)

机器学习笔记之K-means聚类

其定义为对未知标记的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据尽可能接近,类别间的数据相似度比较大。用于衡量距离的方法主要有...

962
数据小磨坊

美团点评 · 商业分析师 (已认证)

机器学习笔记之KNN分类

KNN模型的核心思想很简单,即近朱者赤、近墨者黑,它通过将每一个测试集样本点与训练集中每一个样本之间测算欧氏距离,然后取欧氏距离最近的K个点(k是可以人为划定的...

784
数据小磨坊

美团点评 · 商业分析师 (已认证)

突然有一个大胆的想法,提前分享给大家

也是由于前段时间工作中遇到一个很小文本分析的需求,虽然最后不了了之了,但是却勾起来自己对文本分析的极大兴趣。

561
数据小磨坊

美团点评 · 商业分析师 (已认证)

leaflet在线地图之热力密度图

之前在练习leaflet的时候没有找到R语言leaflet中的热力密度图接口函数,一直感觉很遗憾。

832
数据小磨坊

美团点评 · 商业分析师 (已认证)

使用Python中的folium包创建热力密度图

最近探索出来一个在Python中创建热力图非常高效的方法,使用folium包来创建热力图,实际效果非常赞,过程简单,代码量少。

1142
数据小磨坊

美团点评 · 商业分析师 (已认证)

构建自己的地理信息空间数据库及与客户端简单交互

最近研究了下postgresql数据库及其空间地理信息拓展插件——postgis。

862
数据小磨坊

美团点评 · 商业分析师 (已认证)

Python数据可视化与basemap数据地图系列2——点线图

前一篇介绍了如何使用mpl_toolkits包中的basemap模块制作填充地图,这一节继续分享线图+点图的应用。

922
数据小磨坊

美团点评 · 商业分析师 (已认证)

Python可视化与basemap数据地图系列1

最近在梳理Python中可以制作数据地图的可视化工具包,分别实践了geopandas、folium、Basemp,通过对比发现,静态地图中最为成熟的最终还得是B...

1445
数据小磨坊

美团点评 · 商业分析师 (已认证)

空间数据可视化与simple future模型应用

这是一篇关于关于空间地理信息数据可视化与simple feature 模型应用的笔记小结。

933
数据小磨坊

美团点评 · 商业分析师 (已认证)

ggplot2都有哪些使用不多但是却异常强大的图层函数

要说ggplot2中那些使用不多但是却功能强大的图层函数,我首先想到的就是geom_rect、geom_linerange、geom_segment、geom_...

1363

扫码关注云+社区