我想征求你对我自己的分析系统的建议。到目前为止,我的系统收集所有的点击并将它们保存在SQL数据库中。
第一部分分析。
SQL数据库logs 如下所示:
+----+----------------------+-------------+---------------------------------------------+----------------+--------------+----------+
| id | time | address | address_to | ip | resolution | id_guest |
|----+----------------------+-------------+---------------------------------------------+----------------+--------------+----------|
| 1 | 2013-12-03#14:31:35 | index.php | https://www.youtube.com/watch?v=6VJBBUqr1wM | 89.XX.XXX.6 | 1366x768 | 6 |
| 2 | 2013-12-03#14:48:21 | file.php | https://www.youtube.com/watch?v=0EWbonj7f18 | 89.XX.XXX.6 | 1366x768 | 6 |
| 3 | 2013-12-03#16:16:55 | contact.php | https://www.youtube.com/watch?v=_o-XIryB2gg | 178.XX.XXX.140 | 1920x1080 | 11 |
| 4 | 2013-12-03#16:21:32 | index.php | https://www.youtube.com/watch?v=z0M96LyTyX4 | 178.XX.XXX.140 | 1920x1080 | 11 |
| 5 | 2013-12-03#16:44:32 | movies.php | https://www.youtube.com/watch?v=cUhPA5qIxDQ | 178.XX.XXX.140 | 1920x1080 | 11 |
+----+----------------------+-------------+---------------------------------------------+----------------+--------------+----------+每次单击都会作为新记录添加到数据库中。
我网站上的所有电影都在SQL数据库中的第二个表上(、movies、):
+----+----------------------+-------------+---------------------+
| id | name | address | tags |
|----+----------------------+-------------+---------------------|
| 1 | 2013-12-03#14:31:35 | 6VJBBUqr1wM | bass,electro,trance |
| 2 | 2013-12-03#14:48:21 | 0EWbonj7f18 | electro,house,new |
| 3 | 2013-12-03#16:16:55 | _o-XIryB2gg | electro,party,set |
| 4 | 2013-12-03#16:21:32 | z0M96LyTyX4 | trance,house,new |
| 5 | 2013-12-03#16:44:32 | cUhPA5qIxDQ | techno,new,set |
+----+----------------------+-------------+---------------------+一切都完美无缺。在数据库中,我有用户观看的所有电影,我想要精确地定义这些电影,所以写下IP +分辨率。
第一个问题:是确定用户的好方法吗?
--
第二部分分析。
现在我想使用收集的日志和基于浏览材料的电影显示界面。我从数据库中为进入网站的用户选择所有日志。我从日志中选择标识符胶片,并在表components中扫描它,以获取日志并放入数组中。例如,具有ID = 6的用户将拥有一个数组:
array(
[0] = > bass,
[1] = > electro,
[2] = > trance,
[3] = > electro,
[4] = > house,
[5] = > new
);现在,我将按照最常见的顺序对数组的内容进行排序:
array(
[2] = > electro,
[1] = > bass,
[1] = > trance,
[1] = > house,
[1] = > new
);根据数组的内容可以显示用户可能感兴趣的视频。
一切都很完美,但我现在才发现的问题.在表logs中,我已经有超过450万张记录。正如你可以想象的那样,搜索这么多的记录需要花费大量的时间,而进入网站有时长达10秒.
我希望我糟糕的英语说得很清楚。
请提供任何意见,如何解决这个问题,通过加载页面。
发布于 2014-05-19 11:29:16
user_id、tag、count的表。https://stackoverflow.com/questions/23736019
复制相似问题