PDFMV框架的P

以下文章来源于数据思践 ,作者王路情

这是我的第54篇原创文章,关于PDFMV框架。

阅读完本,你可以知道:

1 PDFMV框架的P是什么

PDFMV框架是“问题-数据-特征-模型-价值”英文字母的缩写,是一个闭环的系统,具有持续性迭代优化的功能。

PDFMV框架的P是“Problem”的缩写,表示“问题”。关于P的认知,如下图所示:

1

Why-Problem

对于问题,我们首先要问“为什么”

  • 为什么要提出这个问题?
  • 为什么要研究这个问题?
  • 为什么要解决这个问题?

我们可以从问题的价值性来看待“Why-Problem”。我们可以进一步探讨:

  • 问题有价值和意义吗?
  • 问题的价值可以量化吗?
  • 问题的受益者是谁?
  • 问题的风险和回报分析是什么?

总体原则,我们是在有价值的问题导向下开启数据科学项目

2

What-Problem

我们清楚问题为什么后,是时候考虑“What-Problem”了,简称为“问题的定义”

关于问题的定义,我们需要:

1 具体化,问题描述越具体,说明对问题理解越透彻,意味着能够更有效地解决问题。

2 合理化,我们要清楚所提出问题的基准线是什么,期望值是什么,所出背景和现状是什么,立足当下,实现增进。

3 数字化,问题所涉及的关键指标采用数字量化。

3

How-Problem

我们怎么解决好问题,这是“How-Problem”需要回答的。

我们要做问题细化的工作,直到问题不能再分解。我把它称之为“分解的哲学”。老子说,“天下难事必作于易,天下大事必作于细。是以圣人终不为大,故能成其大。

面对任何要解答的问题,我们首要是做好充分细化后,就可以采用敏捷开发的模式和迭代优化的方式来快速响应问题和高效破解问题。

4

举例说明

智慧金融领域的用户申请评分

1 Why-Problem

用户申请评分通过一个分数量化用户的违约风险概率,帮助做风险控制,提升信贷效率,显然这个问题是有价值的,解决好这个问题也是必要的。

2 What-Problem

对一款信贷产品的申请用户,进行信用评分,信用评分的可靠性指标KS不少于30%,稳定性指标PSI不超过0.05。

3 How-Problem

解决好这个问题,我们要做这些细化工作。

第一步:用户群的锁定,目标标签的界定,样例的收集

第二步:数据的探索和分析,变量的分箱,特征的选择

第三步:模型的构建和评价

第四步:违约概率到分数刻度的转换

做好细化工作后,我们选择合适的工具,就可以去解答这个问题了。在解答的过程中,我们采用敏捷开发的模式和迭代优化的方式,以让这个评分更加可靠和稳定。

关于PDFMV框架的P,您有什么疑问或者想法请留言。

本文分享自微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-02-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 支持向量机SVM介绍|机器学习

    (一)SVM的八股简介 支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高...

    陆勤_数据人网
  • 【Python环境】如何使用正确的姿势进行高效Python函数式编程?

    关于函数式编程 有哪些函数式语言? 其实函数是语言很早就出现了,上世纪30年代出现的Lambda和50年代的LISP,比面向过程和对象的语言出现的更早,现代的C...

    陆勤_数据人网
  • 【知识】使用Python来学习数据科学的完整教程

    编者按:Python学习和实践数据科学,Python和Python库能够方便地完成数据获取,数据探索,数据处理,数据建模和模型应用与部署的工作,对于数据科学工作...

    陆勤_数据人网
  • 关于Reference的与finalize的一点思考和研究

    最近读了寒泉子关于Finalizer的分享 JVM源码分析之FinalReference完全解读 - InfoQ 结合之前对java引用类型的了解,突然想到几个...

    左手java右手go
  • 安全编码实践之二:跨站脚本攻击防御

    过去几个月我一直致力于安全代码实践,我一直在努力与社区讨论易于采用的方法。我们每天看到的不安全代码的数量确实令人震惊,我们都同意“预防胜于治疗”。

    Bypass
  • python爬虫教程:《利用Python爬取表情包》

    Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以小的给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,欢迎前来领取...

    python学习教程
  • 由表达矩阵看内部异质性

    另外,注意最好每次运行代码之前,都要清空一下变量,然后设置不要将字符型变成因子型向量

    生信技能树jimmy
  • task函数与function函数的FPGA使用

    任务就是封装在“task-endtask”之间的程序,任务通过调用来执行,任务可以彼此调用,而且任务内还可以调用函数。

    根究FPGA
  • 短租房现状分析

    https://tianchi.aliyun.com/competition/entrance/231715/information

    用户6825444
  • 案例丨颠覆保健行业传统营销模式,小程序上线一年,交易量破1亿

    说到小程序,想必大家都不陌生了,从起初的不太被了解,到现在各行业都在争抢做小程序,可见小程序的潜力之大。单纯从保健养生这个行业来看,不少项目负责人表示小程序未来...

    极客小程序分享

扫码关注云+社区

领取腾讯云代金券