作为后台,我收集应用程序的API使用日志(请求、响应、延迟、userId等)。典型的一天会累积2-3亿条记录。这些数据目前以拼图格式存储在s3上,我使用AWS Athena进行即席查询。我想要构建一个基于web的仪表板,它将显示每个客户的指标;一个示例查询将是过去6小时内按客户的请求量。我只需要之前30天的详细使用数据。
理想情况下,我将继续利用AWS生态系统来实现此解决方案。我试图确定的是一个大致的方向。Redshift能否在1s左右的时间内,根据原始日志数据高效地计算出这些类型的查询,使其在web上可用?有没有更好的工具?或者,我是否应该考虑运行ETL和rollup类型的操作来生成这些指标,填充不同的表(可能是redshift),然后使用它为仪表板提供服务?
欢迎任何想法,甚至是建议阅读--谢谢。
发布于 2020-06-20 20:02:01
对于这类问题,你可以使用的方法有很多,我将尝试根据上面的问题详细介绍一些你可以使用的产品。
连接来自数据湖的查询
https://stackoverflow.com/questions/62485282
复制相似问题