【05期】我的数据心经:从数据到智能

【05期】我的数据心经:从数据到智能

更新时间20170204

个人体会:单一的数据是完全没有意义的,只有在特定的背景下,才变成信息;对信息进行挖掘,发现其中的规律,成为了知识。在信息足够丰富的情况下,用机器实现自动获取知识,形成了人工智能。“智能”一词,并非单指人类才能独有。在《三体》小说中,一个观点是非生命体的低纬度的智子,仍然具备智能。毫无疑问,随着数据挖掘技术的进步,机器的“智慧”越来越高级,预测越来越准确。当机器给人类的决策建议,人类大部分都接受了,其实,机器从某个侧面上控制了人类。

来源:依据涂子沛的书《数据之巅》相关模型进行总结和改进

标签:数据分析、大数据、数据层次

摘录时间:2016年12月1日

【04期】我的数据心经:人工智能、机器学习和深度学习的关系

更新时间20161129

三者是包含的关系;

人工智能(Artificial Intelligence)为机器赋予人的智能;

机器学习是一种实现人工智能的方法,其最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测;

深度学习是一种实现机器学习的技术,如神经网络算法等。

个人体会:人工智能在上世纪50年代就提出,为何近期才火爆?个人觉得关键是“计算能力”。摩尔定律揭示,当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。随着芯片计算能力的增强,分布式大数据计算架构发展,挖掘算法的完善,通过对海量数据的挖掘,使机器具备“智慧”成为可能。另一个重要原因是在互联网推动下,人类信息化程度得到长足提升,数据纬度和数量剧增,语音和图像识别技术也逐渐成熟。未来,机器将拥护很高的智慧,这是必然趋势。

【03期】我的数据心经:欺诈发现的三种思路

更新时间20161121

个人体会:对业务的深度理解,是发现欺诈行为的非常重要前提。此前在中国移动从事短信精准营销时,发现参与活动的“活跃”用户,其实是套利的用户(渠道分销商屯放电话卡,通过参与活动获得话费、优惠券和套取手机等方式获利,通称卡商)。针对他们的行为分析,发现他们的被动接电话次数和通话时长很低。后来在营销活动上,要求目标用户要锁定用户群(非全量,避免新号码套利),对号码有效性设置一定的门槛(比如被叫次数和被叫通话时长等指标要达到一定要求),从而规避套利风险,实现效果非常好。

在基于业务理解情况下,通过异常值分析、分类模型预测等,可以拟补通过业务经验无法发现的套利行为。

来源:张文彤、钟云飞在人大论坛的SPSS数据挖掘培训视频

标签:欺诈识别、数据挖掘

摘录时间:2016年9月1日

【02期】我的数据心经:模型验证

更新时间20161116

个人体会:模型效果验证除了以上指标外(常用的是准确率、覆盖率和增益图),在落地实施时一般要进行效果评估,通常是分三组(模型组、随机组和经验组)实施。经验组是业务和产品人员根据工作经验筛选出的目标用户。三组比较效果时,要考虑抽取比例一样(比如都抽取1%)或规模一致(比如都是100万)。

来源:张文彤、钟云飞在人大论坛的SPSS数据挖掘培训视频

标签:模型验证、流失预测、数据挖掘

摘录时间:2016年9月1日

【01期】我的数据心经:数据十戒

更新时间20161115

数据十戒

1、一切从定义问题开始,问题问好了,答案就在那里。

2、在万物皆数据的年代,要以“假设数据都能获取”为前提去思考问题。

3、数据助力企业的“四部曲”:描述现状、深入诊断、预测趋势、指挥行动。

4、“快+准”的数据,让我们可以从已知规律中寻找价值。

5、“广+乱”的数据,给予我们从发现中获取颠覆过去规律的能力。

6、大数据不是独奏,而是连接无处不在的数据。

7、数据技术就是加速和积累(数据、分析、服务)的能力。

8、大数据生态的链接需要建立标准与规范。

9、大数据是诸多小数据的组合。

10、数据是一种信仰。

个人体会:数据分析是个累活,数据分析师在企业中的价值远未被开发和使用,累但未体现价值,是大部分数据分析师的感受。在大数据趋势下,数据分析师会发挥更大的作用,数据化运营与运营数据,促使其自身价值被得到认可。但这个过程是漫长的,无信仰,不数据,需要坚持。

原文发布于微信公众号 - 数据的力量(shujudeliliang)

原文发表时间:2017-02-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

【业界】谷歌投资的“算法商店”Algorithmia推出基于区块链的协议

研究机器学习算法的研究人员现在有了尝试和帮助AI社区的新动力:加密货币。 ? 图:Algorithmia首席执行官Diego Oppenheimer Algor...

3215
来自专栏大数据文摘

CrowdFlower数据科学家17年调查报告:情愿断腿也不想丢数据

1766
来自专栏ATYUN订阅号

ScriptBook利用AI预测电影剧本是否会带来票房

提供人工智能设备的公司ScriptBook的创始人表示,如果索尼电影公司利用它们的算法而不是人类来评审电影,索尼原本可以在2015年到2017年节省一大笔资金。

1163
来自专栏新智元

【AI解放排队】使用GPU机器学习的快速ID识别技术,效率提升50%

【新智元导读】据说英国人一生中有六个月在排队;美国人全年要花370亿小时来排队。德国一家金融科技公司 IDnow开发 GPU加速识别解决方案,让人们在需要照片I...

2856
来自专栏数据科学与人工智能

【数据科学】统计算法在Kaggle数据科学竞赛成功

最近,数学建模平台Kaggle举办了一个大数据联合竞赛来预测股票价格的短期变化。 联合举办的另一个平台BattleFin——也是致力于众包投资分析人才的发现和培...

2455
来自专栏AI科技评论

业界|解密Persado背后的秘密武器:机器学习如何创作营销内容

目前为止,基于机器学习的个性化功能仍集中于行为和偏好,即找到“对的人”、“对的地方”和“对的时间”。现在,新的机器学习技术把情绪因素纳入计算方程,以做到更好的信...

2895
来自专栏新智元

福布斯:AI商业落地视角必须实际可行,影响企业盈余关键是预测

【新智元导读】本文作者综合从科技作者,研究科学家到企业创始人的观点,提出 AI 的落地中提供给企业的关键优势是预测,而且利用 AI 的预测只会越来越准确,同时也...

34511
来自专栏数据科学与人工智能

【FinTech】Fintech机器学习,所有你必须知道的

金融世界处理统计数据和定量数字,使其成为机器学习(ML)的完美领域。 这种工程科学已经应用于医疗,旅游,媒体和零售等不同领域。

962
来自专栏北京马哥教育

专注是一种能力,你是否缺失?

互联网正在不知不觉中改造着我们的大脑,使我们失去深度阅读和缜密思维的能力。我们的注意力如今如此分散支离——专注做事,有时竟已成为了一种稀缺能力。然而不管对工作还...

32915
来自专栏大数据文摘

Algorithmia:算法的应用商店

1896

扫码关注云+社区