前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >开启数据挖掘之旅——以Python应用案例讲解(NO1

开启数据挖掘之旅——以Python应用案例讲解(NO1

作者头像
机器思维研究院
发布2019-08-29 17:27:26
5790
发布2019-08-29 17:27:26
举报
文章被收录于专栏:AI机器思维AI机器思维

作者:Nature

出品:AI机器思维

业务使用者更多的将精力放到业务本身——避免过渡关注算法原理

随着大数据、人工智能、区块链、物联网、移动互联网等的发展,学科的界限变得比较模糊,各学科交叉融合的趋势在增强,数学的重要性在提升。未来的大学教育不在局限在哪个专业,打破专业的思维局限自己的发展成为趋势。

未来数学与计算机融合发展,借助计算机改变传统数学教育方法,提升数学学习兴趣应用到一线教学可能带来数学大发展。从应用的角度,业务人员只需要应用算法,不需要太多关注算法的数学知识,估计能提高学习的热情。

减少关注算法的工作原理,提升使用这些算法的案例,就像我们开车会开就可以,不用过渡关注汽车的制造原理。驾驭好开车正如业务人员驾驭好使用算法,会调节参数就可以。

对于学习python这门语言,目前之所以比较火,是因为其在数据分析与数据挖掘的应用得到了检验。Python是一种通用型编程语言,它简单易学,上手快,有着丰富的第三方库,社区氛围友好。

从数据采集与处理、分析与挖掘一直到应用开发层面,Python都有成熟的库。使用Python语言进行开发,无需过多关注语言细节,开发者可以将主要精力放到业务本身,只要会用就可以,专业的人员干专业的事,语言深层次的开发与算法理解交给研究者,避免走入研究数学算法推导与技术的误区。理解数据挖掘的基础知识,掌握用数据挖掘知识解决问题的方法,提升业务应用是关键。

搭建数据挖掘环境,理解使用语言工具是基础,跟着业务案例学习,提升业务应用价值是关键。正如我们希望通过计算机把网页翻译成其他语言,推荐理财,预报天气,推荐喜欢的文章,诊断健康等。通过数据挖掘技术可以用来训练其在某个领域的应用,提升其更高的精确度。

随着开源的市场需求,数据分析与数据挖掘对Python的迅速普及应用并非偶然。基于它的灵活度高,模块众多,可以执行很多任务;比起其他任何 编程语言,Python代码通常更为简洁,可读性更强。Python在数据挖掘领域已经形成了一个由研究员、从业者和新手组成的强大社区。

如何学习数据挖掘?个人建议需要从以下几个方面着手:

○理解数据挖掘流程及其应用场景

○搭建数据挖掘环境——如搭建python数据挖掘环境

○根据实际案例学习

○迭代应用到场景,反思数据挖掘的不足之处,逐渐提升应用场景价值。

数据挖掘本身不复杂,明确业务、理解业务是关键。通过收集相关的业务数据,让计算机借助算法模型做出基于数据的决策都属于数据挖掘。如天气数据预测未来几天的天气、拦截垃圾短信、拦截垃圾电话,预测客户购买意向等。

对于真正想学习数据挖掘的业务人员,需要适当了解下算法、统计学、计算机编程等相关领域的知识。同时对语言学、神经学、数据科学等整合这些业务相关的特点领域知识。虽然数据挖掘不同的业务场景千差万别,但整个开发流程基本相同,只是算法引用不同,从较高层次看,它们往往大同小异。数据挖掘的第一步一般都是对数据挖掘业务场景分析,全都是用场景,然后收集业务场景相关的数据并建立数据挖掘数据集,这些数据能够描述真实世界的业务场景。数据集收集是最耗费时间和精力的一个过程,有效的数据是关键,否则其他都是错误的。

对业务场景中选择合适的数据挖掘算法,引用数据集,调整算法,每种数据挖掘算法都有参数,这些参数有的是算法自身包含的,有的可能是使用者添加的,这些参数会影响算法的具体决策。

第二讲以python应用讲解,本讲开篇从宏观上和心得上让大家对数据挖掘产生一个简单应用的感觉,不畏艰难才能勇往直前!

——往期精彩——

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI机器思维 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
短信
腾讯云短信(Short Message Service,SMS)可为广大企业级用户提供稳定可靠,安全合规的短信触达服务。用户可快速接入,调用 API / SDK 或者通过控制台即可发送,支持发送验证码、通知类短信和营销短信。国内验证短信秒级触达,99%到达率;国际/港澳台短信覆盖全球200+国家/地区,全球多服务站点,稳定可靠。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档