前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据挖掘的7个重要技术

数据挖掘的7个重要技术

作者头像
企鹅号小编
发布2018-01-09 15:07:06
9680
发布2018-01-09 15:07:06
举报
文章被收录于专栏:人工智能人工智能

数据挖掘技术

数据挖掘是查看大型信息库以生成新信息的过程。直觉上,你可能认为数据挖掘是指提取新的数据,但事实并非如此; 相反的,数据挖掘是从已经收集的数据中推断出新的模式和知识。

数据挖掘专家们在自己所在的领域,依靠数据库管理,统计和机器学习的交叉技术,可以更好地从大量数据中获取到自己想要的结论。但是,他们使用什么技术来实现这一点呢?

回答是:”数据挖掘技术”

只要利用以下技术中的一种或多种,数据挖掘则会变得非常有效:

1.跟踪模式。数据挖掘中最基本的技术之一就是学习识别数据集中的模式。这通常是对您的数据在有规律的时间间隔内发生的一些异常的认识和发现,或者是随着时间的推移某个变量的起伏监控。例如,您可能会发现某个产品的销售量在节假日之前似乎会大幅上涨,或者注意到天气变暖会吸引更多人访问您的网站,这些因素导致的后期的“化学变化”都应该是被跟踪和被发现的对象。

2.分类。分类是一种更为复杂的数据挖掘技术,它迫使您将各种属性集中到可识别的类别中,然后您可以使用这些类别得出进一步的结论或提供某种功能。例如,如果您正在评估有关个人客户财务背景和购买历史记录的数据,则可以将客户归类为“低”、“中”、“高”三个级别的信用风险。然后,您可以使用这些分类来管理和掌握更多关于这些客户的信息。

3.联想。联想与跟踪模式有关,但是更具体地依赖于相关联要素的变量。在这种情况下,您将查找与另一个事件高度相关联的特定事件的属性:例如,您可能会注意到,当您的客户购买特定物品时,他们还经常购买第二个相关物品。就像我们经常在网购的时候看到“人们也买了……”的提示一样。

4.异常值检测。在许多情况下,仅仅认识到总体模式并不能让你清楚地理解你的数据集。您还需要能够识别数据中的异常值。例如,如果您的购买者几乎全是男性,但是在七月的一个特定的一周,女性购买者的数量突然大幅上升,您需要调查这个高峰,看看是什么推动了它的发生,从而在今后的运营中更好的利用它,并且也是一个很好的手段来更好的了解您的用户。

5.聚类。聚类与分类非常相似,但是聚类是根据数据块的相似性将它们分组在一块。例如,您可以根据用户的可支配收入多少,或者用户在商店购物的频率,选择将不同的用户统计分类到不同的数据包中。

6.回归。回归主要用作计划和建模的一种形式,考虑到其他变量的存在,往往会用于确定某个变量的可能性。例如,您可以根据可用性,消费者需求和竞争等其他因素,使用它来投射某个价格。更具体地说,回归的主要焦点是帮助您揭示指定数据集中两个(或更多)变量之间的确切关系。

7.预测。预测是最有价值的数据挖掘技术之一,因为它用于投影将来会看到的数据类型。在许多情况下,仅仅认识和理解历史趋势就足以对未来将发生的事情进行准确的预测。例如,您可以查看消费者的信用记录和过去的购买情况,以预测他们将来是否会有信用风险。

如何用好数据挖掘工具

那么你是否需要最新最好的机器学习工具来应用这些技术呢?不一定。实际上,您可以用相对适中的数据库系统和一些简单直接可对接的大数据工具来完成一些尖端的数据挖掘工作。如果你没有合适的工具,可以找一家大数据服务商看看,通常大数据服务商会提供根据不同需求和场景的大小产品工具和服务。

只要你运用正确的逻辑,尝试不同的思路,从而得出不同的结论,这些结论有可能彻底改变你的企业。

2018,是新时代大数据的黄金时间,也是企业发展的分水岭,如何用好大数据技术,是每一个企业必须面对的问题。

END

本文来自企鹅号 - 凡闻科技媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 凡闻科技媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档