假设我有一个网站,它的点击率很高。我需要将点击数据存储在某个数据库中,以便可以将其用于报告和监控目的。点击数据将包含信息,例如谁将用户引用到此站点,用户从哪里来,他们什么时候来等。是否有一种方法可以存储这些数据,然后以10分钟为间隔进行分析,这样您就可以每隔10分钟获得站点运行情况的概述。哪种类型的数据库最适合于此目的,以及哪种分析工具可以从该数据快速生成有意义的信息。我正在考虑的一种分析方法是使用map-reduce的一些变体来对此数据运行查询。
发布于 2011-04-09 14:55:58
虽然我还没有尝试过,但OpenTSDB看起来很有前途。
引用:
OpenTSDB是在HBase之上编写的分布式、可伸缩的时间序列数据库。编写OpenTSDB是为了满足一个共同的需求:大规模地存储、索引和服务从计算机系统(网络设备、操作系统、应用程序)收集的指标,并使这些数据易于访问和抓取。
https://stackoverflow.com/questions/5585660
复制相似问题