前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

作者头像
Maynor
发布2021-12-07 11:07:08
1980
发布2021-12-07 11:07:08
举报

前言

在这里插入图片描述
在这里插入图片描述

本栏目大数据开发岗高频面试题主要出自大数据技术专栏的各个小专栏,由于个别笔记上传太早,排版杂乱,后面会进行原文美化、增加。

文章目录

停不要往下滑了,

默默想5min,

看看这5道面试题你都会吗?

代码语言:javascript
复制
面试题 01、列族设计规则是什么?
面试题02、Hive on Hbase的实现原理是什么?
面试题 03、Phoenix是什么?
面试题04、什么是二级索引?为什么要构建二级索引
面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

以下答案仅供参考:

面试题 01、列族设计规则是什么?

•个数原则:如果列的个数比较多,建议2 ~ 3个,如果列的个数比较少,建议1个 –列族个数多了,导致比较次数变多,降低性能 –列族个数少了,导致列的比较次数变多,降低性能 •长度原则 :能满足业务需求的情况下,越短越好

面试题02、Hive on Hbase的实现原理是什么?

•Hive on Hbase的原理是通过MapReduce实现对Hbase数据的读写 •MapReduce中提供了TableInputFormat读取Hbase数据,TableOutputFormat写入数据到Hbase

面试题 03、Phoenix是什么?

•Phoenix是一个专门为Hbase设计的SQL on Hbase的工具 •底层通过Hbase API和大量的协处理器实现 •可以实现基于SQL访问Hbase以及构建维护二级索引等功能

面试题04、什么是二级索引?为什么要构建二级索引

•二级索引指的是基于一级索引之上再构建一层索引 •Hbase使用Rowkey作为唯一索引,只有使用Rowkey前缀进行查询,才走索引查询 •导致大部分的查询都是不走索引,性能比较差 •通过建立二级索引,可以通过走两次索引代替全表扫描,加快查询速度

面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

•全局索引 •覆盖索引 •本地索引 •函数索引

总结

今天我们复习了面试中常考的Hbase相关的五个问题,你做到心中有数了么?

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-07-30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
    • 文章目录
    • 面试题 01、列族设计规则是什么?
    • 面试题02、Hive on Hbase的实现原理是什么?
    • 面试题 03、Phoenix是什么?
    • 面试题04、什么是二级索引?为什么要构建二级索引
    • 面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?
    • 总结
    相关产品与服务
    TDSQL MySQL 版
    TDSQL MySQL 版(TDSQL for MySQL)是腾讯打造的一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档