我是大数据世界的新手。作为一个课程项目,我正在从事传感器网络的工作,并希望将传感器数据存储在HBase上。目前数据存储在MySQL数据库中。我正在尝试将这些数据加载到HBase中。但数据增长如此之快,对此的查询变得非常缓慢。下面是MYSQL表模式: SensorLog(sensorID,userID,time,date)。因此,此表保存了传感器触发日志。对于每个用户(总共45个用户),他的公寓中有25个运动传感器。每当用户在他的公寓中移动时,传感器都会触发,并且此事件将记录到此表中。主要问题是,在特定的时间间隔和日期内,为特定用户触发了哪些传感器。
我想出了threeHBase模式,我想请教您对它们的意见。在这些模式中,我将时间表示为一天中秒数,即0-86400范围内的整数。
Schema1:行键:日期;列族:时间{ cq:(t0-t86400);cv:(userID,sensorID)}
Schema2:行键:(日期,userID);列族:时间{ cq:(t0-t86400);cv:(sensorID)}
Schema3:行键:(日期,userID);列族:时间{ cq:(s1-s25);cv:(时间)}
你能告诉我哪种方案更好更有效吗?我很感谢任何提前提供的帮助。
https://stackoverflow.com/questions/18950662
复制相似问题