首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >kognitio中不同类型的成像技术

kognitio中不同类型的成像技术
EN

Stack Overflow用户
提问于 2015-07-22 10:07:37
回答 2查看 95关注 0票数 1

有谁能解释一下科尼季奥所有的成像技术。

如果你能介绍下面的技巧,那就太好了。

1)复制

2)通过(column_name)复制分区映像

3)对(column_name)分区图像(column_name)进行散列处理。

提前谢谢。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-07-28 09:46:52

我们有四个不同的成像选项在WX2随机-甚至循环罗宾分布(默认)哈希-放置到内存存储根据键部分哈希-作为散列,但处理扭曲的属性复制-完整的副本在每个内存存储。

复制将图像的副本放在每个RAM存储区上。就RAM和重新分配时间而言,这可能是很昂贵的。对于小型查找/维度表来说,它不能被分割。这是西塔会合的必要条件。复制是每个RAM存储而不是每个节点。

散列在RAM存储中分配表或视图映像的行。它取决于一个或多个列的值。它有利于连接大型表--公共密钥上的散列。它可能会导致倾斜。不同值的数量少于RAM存储的数量。一个或两个数值在频率上大大超过其他值。部分分布可以用来中和值的偏差。

当大表在键列上严重倾斜时,部分散列是一种处理联接的机制。它是直接散列的另一种选择。类型是部分散列/随机RAM存储和部分散列/复制跨RAM存储。

票数 1
EN

Stack Overflow用户

发布于 2015-07-23 14:51:05

Kognitio社区论坛文章这里有指向所有最新文档的链接。

特别是,Kognitio指南第2章涵盖了现有的各种表和视图图像选项。

原质询所提及的问题如下:

  1. 复制-在这里,将对象的副本放置在每个ram存储进程中。这通常用于维度对象,允许将它们连接到大型对象,而不管这些对象是随机分布的还是散列的。
  2. 分区(决定是否分区独立于您是否在复制/随机/散列)--这允许ram存储对属性进行分区。主要的好处是可以在扫描时消除分区,从而减少处理的数据量。不过,请注意有关分区的文档中的进一步注释。
  3. 散列-对属性进行散列允许根据属性值分发数据。例如,在一个零售示例中,您可以通过customer_id散列customer表,并对事务表执行相同的操作,然后任何给定的事务都与相关的客户记录位于同一个ram存储区中。请注意,此发行版很容易倾斜;因此,有关使用部分分发来击败偏斜的详细信息,请参阅文档。
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31560076

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档