首页
学习
活动
专区
工具
TVP
发布

数据小魔方

专栏成员
471
文章
1083851
阅读量
142
订阅数
分类模型的评价方法
机器学习中对于分类模型常用混淆矩阵来进行效果评价,混淆矩阵中存在多个评价指标,这些评价指标可以从不同角度来评价分类结果的优劣,以下内容通过简单的理论概述和案例展示来详细解释分类模型中混淆矩阵的评价指标及其用途。
数据小磨坊
2018-12-12
1.3K0
一个敲有趣的R语言拼图工具
在10月CRAN更新的R包中,发现了一个挺有意思的R包——customLayout,听名字就很神奇。
数据小磨坊
2018-12-07
1.3K0
机器学习笔记——哑变量处理
在机器学习的特征处理环节,免不了需要用到类别型特征,这类特征进入模型的方式与一般数值型变量有所不同。
数据小磨坊
2018-10-23
3.1K0
机器学习笔记——特征标准化
数据标准化是为了消除不同指标量纲的影响,方便指标之间的可比性,量纲差异会影响某些模型中距离计算的结果。
数据小磨坊
2018-10-23
6610
机器学习笔记——数据集分割
在模型训练之前,要首先划分训练集与测试集,如何对原始数据集进行训练集与测试集的划分?训练集与测试集的比例各占多少?如何保证各自内部标签分布平衡都会影响模型训练的最终效果。
数据小磨坊
2018-10-23
1.9K0
Julia语言初体验
最近MIT发布的julia 1.0.0版,据传整合了C、Python、R等诸多语言特色,是数据科学领域又一把顶级利器。
数据小磨坊
2018-08-30
5.8K0
如何处理地图投影转换
最近学习地理信息可视化总是遇到投影的麻烦,包括前段时间输出两篇关于simple features的分享中,其中没有特别处理投影的问题,老司机一看就能看出其中存在的投影问题。
数据小磨坊
2018-08-16
1.8K0
批量将本地gis数据导入postgis数据库
以前在处理gis数据的时候,都是直接导入本地shp素材、本地geojson素材,本地topojson素材,自从接触postgis数据之后,深感使用规范的存储系统来统一管理gis数据的好处,特别是数据量大了之后,优势便更加明显,你可以选择将很多需要做空间计算的步骤转移到Postgis数据库内进行计算,要知道Postgis提供的空间计算能力与R和Python这种应用导向的工具相比,优势要大得多。
数据小磨坊
2018-08-16
2.4K0
金融数据获取的api接口
最近苹果的股价一路疯长,继周四突破万亿美元市值后,周五盘中高点、收盘价双创新高。盘中高点达208.74美元,收盘价报207.99美元,上涨0.29%,创历史收盘新高,市值达10045.76亿美元。
数据小磨坊
2018-08-16
8.1K0
rmarkdown+flexdashboard制作dashboard原型
R语言作为一门统计计算和数据可视化为核心特色的工具性语言,其在可视化领域或者说数据呈现方面有着非常成熟和系统的解决方案。
数据小磨坊
2018-08-16
4.3K0
机器学习笔记之KNN分类
KNN模型的核心思想很简单,即近朱者赤、近墨者黑,它通过将每一个测试集样本点与训练集中每一个样本之间测算欧氏距离,然后取欧氏距离最近的K个点(k是可以人为划定的近邻取舍个数,K的确定会影响算法结果),并统计这K个训练集样本点所属类别频数,将其中频数最高的所属类别化为该测试样本点的预测类别。
数据小磨坊
2018-07-25
8720
leaflet在线地图之热力密度图
之前在练习leaflet的时候没有找到R语言leaflet中的热力密度图接口函数,一直感觉很遗憾。
数据小磨坊
2018-07-25
2.1K0
构建自己的地理信息空间数据库及与客户端简单交互
最近研究了下postgresql数据库及其空间地理信息拓展插件——postgis。
数据小磨坊
2018-07-25
6K0
Python数据可视化与basemap数据地图系列2——点线图
前一篇介绍了如何使用mpl_toolkits包中的basemap模块制作填充地图,这一节继续分享线图+点图的应用。
数据小磨坊
2018-07-25
3.1K0
Python可视化与basemap数据地图系列1
最近在梳理Python中可以制作数据地图的可视化工具包,分别实践了geopandas、folium、Basemp,通过对比发现,静态地图中最为成熟的最终还得是Basemap工具,它是mpl_toolkits包中的一个专门用于构建地理信息数据可视化的扩展库。
数据小磨坊
2018-07-25
1.9K0
ggplot2都有哪些使用不多但是却异常强大的图层函数
要说ggplot2中那些使用不多但是却功能强大的图层函数,我首先想到的就是geom_rect、geom_linerange、geom_segment、geom_ploygon。
数据小磨坊
2018-07-25
1.6K0
R语言构建层次分析模型不看一下吗~
AHP (Analytic Hierarchy Process)层次分析法是美国运筹学家Saaty教授于二十世纪80年代提出的一种实用的多方案或多目标的决策方法。其主要特征是,它合理地将定性与定量的决策结合起来,按照思维、心理的规律把决策过程层次化、数量化。
数据小磨坊
2018-07-25
1.4K0
R语言构建RFM模型了解一下~~~
RFM模型是市场营销和CRM客户管理中经常用到的探索性分析方法,透过模型深入挖掘客户行为背后的价值规律,进而更好地利用数据价值推动业务发展和客户管理。
数据小磨坊
2018-07-25
2.9K0
ggplot2双坐标轴的解决方案
本来没有打算写这一篇的,因为在一幅图表中使用双坐标轴确实不是一个很好地习惯,无论是信息传递的效率还是数据表达的准确性而言。 但是最近有好几个小伙伴儿跟我咨询关于ggplot2的次坐标轴问题,平时的一些业务分析中,有些场景出于数据呈现的需要,或者阅读习惯等,往往需要在一幅图中呈现两个量级不等的坐标。 所以我觉得这一篇推送很有必要,确实在最新版的ggplot2(ggplot 2.2.0以上版本)中,已经加入了次坐标轴参数,通过这个次坐标轴的转换,我们可以模拟出不同数量级的次坐标轴效果。 因为其中用到了英文月份简
数据小磨坊
2018-04-12
3.5K0
云课堂Excel课程数据可视化分析
我一直是网易云课堂的重度用户,从大二开始就一直在上面学习各种技能类课程,作为互联网在线教育的知名品牌,云课堂在某种程度上弥补了我们从校园到职场过渡过程中,很多技能类知识不足的缺口。 今天这一篇是接着上一篇云课堂Excel课程板块爬虫数据进行多角度的可视化分析,上次的爬虫一共爬取了425条课程信息,一共提取了9个字段。 英文字段名称 中文含义 类型 productId 课程ID 定性 productName 课程名称 定性 lectorName
数据小磨坊
2018-04-11
1.3K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档