首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >数据挖掘?我如何在我的网站上执行它?

数据挖掘?我如何在我的网站上执行它?
EN

Stack Overflow用户
提问于 2010-07-06 08:03:25
回答 3查看 946关注 0票数 1

我正在准备我的计算机科学毕业设计,我制作了这个网站,它运行得很好,但我的导师要求我在网站上应用数据挖掘。但我不知道我该怎么做。该网站是一个社交网络,每个用户将有一个个人资料和博客,并访问一些电子书,要求您注册,以便您可以下载。该网站还包含一个音乐服务器,其中包含歌曲,注册用户可以选择一首歌曲下载或添加到他的个人资料页作为收藏,该网站包含广告(我使用OpenX脚本),所以这是大多数的网站服务,我可以执行数据挖掘,该网站是www.sy-stu.com

我需要想法,在面试中展示它的最佳方式是什么?

EN

回答 3

Stack Overflow用户

发布于 2010-07-06 08:18:06

你可以问你的教授,他使用数据挖掘的意图是什么。数据挖掘算法可以做各种任务,你需要首先定义你想要完成的任务,然后找到一些算法来实现这一点和技术上的可能性。

关于在您的项目中使用数据挖掘,我想到了一些想法:

  1. 您可以使用数据挖掘来查找哪些歌曲(电子书等)
  2. 您可以使用一些聚类算法来根据某些参数对用户进行分组,并建议他们可以成为与同一组中的其他人的联系(如果您有类似的内容)

祝你好运!:)

票数 2
EN

Stack Overflow用户

发布于 2010-07-06 09:54:57

首先,向你的主管要求澄清。不要问“你是什么意思?”,而要问“你期待这样的事情吗?”因为这表明你至少考虑过这一点。

如果你什么都想不出来,或者你的主管语无伦次,那就执行一些简单的数据检索和分析,例如

  • most active members
  • 最受欢迎/最不受欢迎的歌曲和书籍。
  • 广告点击量等
  • 最受欢迎网站功能

仅仅是基础分析就足够了--你不是在攻读统计学学位。计算出每天或每个用户下载的歌曲数量,每个用户的平均歌曲数量,每天有多少用户访问,有多少用户注册但从不访问。

这样做的目的是为了证明你的网站正在记录所有的活动,这样当你被问到“6月份最活跃的20位用户下载了多少本书”时,你就可以找到答案了。

另一种选择是只运行一个网站,而你对用户的行为和他们正在做的事情一无所知,这意味着你无法专注于他们认为重要的事情。

票数 2
EN

Stack Overflow用户

发布于 2010-07-06 08:10:02

我不知道你到底想要挖掘什么样的数据,但是你查过google analytics吗?它很容易设置,一旦你注册了,你所需要的就是包括提供给你的网页的javascript。Google analytics将为你提供大量关于访问你的网站的统计数据,包括你的网站和访问量。这就是你需要的吗?生成的数据也非常容易阅读,我认为它将适合您展示。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3182788

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档