我正在准备我的计算机科学毕业设计,我制作了这个网站,它运行得很好,但我的导师要求我在网站上应用数据挖掘。但我不知道我该怎么做。该网站是一个社交网络,每个用户将有一个个人资料和博客,并访问一些电子书,要求您注册,以便您可以下载。该网站还包含一个音乐服务器,其中包含歌曲,注册用户可以选择一首歌曲下载或添加到他的个人资料页作为收藏,该网站包含广告(我使用OpenX脚本),所以这是大多数的网站服务,我可以执行数据挖掘,该网站是www.sy-stu.com。
我需要想法,在面试中展示它的最佳方式是什么?
发布于 2010-07-06 08:18:06
你可以问你的教授,他使用数据挖掘的意图是什么。数据挖掘算法可以做各种任务,你需要首先定义你想要完成的任务,然后找到一些算法来实现这一点和技术上的可能性。
关于在您的项目中使用数据挖掘,我想到了一些想法:
祝你好运!:)
发布于 2010-07-06 09:54:57
首先,向你的主管要求澄清。不要问“你是什么意思?”,而要问“你期待这样的事情吗?”因为这表明你至少考虑过这一点。
如果你什么都想不出来,或者你的主管语无伦次,那就执行一些简单的数据检索和分析,例如
仅仅是基础分析就足够了--你不是在攻读统计学学位。计算出每天或每个用户下载的歌曲数量,每个用户的平均歌曲数量,每天有多少用户访问,有多少用户注册但从不访问。
这样做的目的是为了证明你的网站正在记录所有的活动,这样当你被问到“6月份最活跃的20位用户下载了多少本书”时,你就可以找到答案了。
另一种选择是只运行一个网站,而你对用户的行为和他们正在做的事情一无所知,这意味着你无法专注于他们认为重要的事情。
发布于 2010-07-06 08:10:02
我不知道你到底想要挖掘什么样的数据,但是你查过google analytics吗?它很容易设置,一旦你注册了,你所需要的就是包括提供给你的网页的javascript。Google analytics将为你提供大量关于访问你的网站的统计数据,包括你的网站和访问量。这就是你需要的吗?生成的数据也非常容易阅读,我认为它将适合您展示。
https://stackoverflow.com/questions/3182788
复制相似问题