前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PDFMV框架的D

PDFMV框架的D

作者头像
陆勤_数据人网
发布2020-02-19 12:20:29
3950
发布2020-02-19 12:20:29
举报

这是我的第56篇原创文章,关于PDFMV框架。

阅读完本,你可以知道:

1 PDFMV框架的D是什么

PDFMV框架是“问题-数据-特征-模型-价值”英文字母的缩写,是一个闭环的系统,具有持续性迭代优化的功能。

PDFMV框架的D是“Data”的缩写,表示“数据”。关于D的认知,如下图所示:

我们从数据中学习,获得洞见,以创造价值。这个数据,可以是小数据,也可以是大数据;可以是结构化的数据,也可以是非结构化的数据;可以是表格数据,也可以是图像、声音、视频数据;可以是离线数据,也可是在线数据。等等。

PDFMV框架的D环节,我们重点关注三方面的事情:

1 数据加载,获取与业务问题相关的数据集,以开启我们的数据工作。

2 数据探索,识别数据通用问题。

3 数据管理,处理数据中的问题集。

1

数据加载

数据加载,如下图

2

数据探索

数据探索,包括数据汇总和数据可视化。

数据汇总,如下图:

数据可视化,如下图:

3

数据管理

数据管理,主要有数据清洗,数据转换和数据划分。

如下图:

温馨提示:

  • 从不修改原始数据文件,总是在数据的副本上工作。
  • 垃圾输入,垃圾输出,数据质量至关重要。
  • 不同的业务问题有着不同的数据留痕。
  • 为了用好数据,先要理解数据,做好数据画像工作。

关于PDFMV框架的D,您有什么想法请留言。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-02-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档