首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【腾讯微视】百亿数据、上百维度、秒级查询的多维分析场景的实践方案

    作者:teachzhang  腾讯PCG工程师 |导语  大数据多维分析是业务中非常常见的分析场景,目前也有许多落地方案,但是在遇到上百亿数据、维度个数不限、秒级返回结果这样的场景时,实现的时候还是遇到了一些挑战。本文介绍了一种参考kylin的预聚合模式实现的存储方案,支持对上百亿数据以及数百个维度的多维分析,并且能在秒级返回查询结果。该方案可以运用于多维指标拆解分析,异动归因分析业务场景。希望给其他有类似分析场景的同学提供一种参考方案,对本内容感兴趣的同学,欢迎一起交流学习。 1. 背景 周报场景:微视

    02

    Kylin快速入门系列(4) | Cube构建优化

    上一篇博文我们已经介绍过,在没有采取任何优化措施的情况下,Kylin会对每一种维度的组合进行预计算,每种维度的组合的预计算结果被称为Cuboid。假设有4个维度,我们最终会有24 =16个Cuboid需要计算。   但在现实情况中,用户的维度数量一般远远大于4个。假设用户有10 个维度,那么没有经过任何优化的Cube就会存在210 =1024个Cuboid;而如果用户有20个维度,那么Cube中总共会存在220 =1048576个Cuboid。虽然每个Cuboid的大小存在很大的差异,但是单单想到Cuboid的数量就足以让人想象到这样的Cube对构建引擎、存储引擎来说压力有多么巨大。因此,在构建维度数量较多的Cube时,尤其要注意Cube的剪枝优化(即减少Cuboid的生成)。

    02
    领券