前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >去哪儿数仓面试题

去哪儿数仓面试题

作者头像
伊泽瑞尔
发布2022-06-01 08:36:26
2810
发布2022-06-01 08:36:26
举报

1.你们的数仓分层怎么分的,为什么要这么分

2.数据是如何接入的,流量日志是如何解析形成事实表的

3.kafka分区与group,consumer消费和partition是如何对应的

4.kafka数据积压如何处理

5.数据倾斜如何优化

6.hdfs小文件如何处理

7.数仓的数据域是如何划分的

8.dwd和dws的区别

9.数据承诺到岗时间如何保证

10.jvm的内存分析如何做

11.微服务中如果程序未抛异常并且没有打日志,如何排查问题

12.服务端被请求没有返回结果,如何排查问题

13.linux如何查看负载使用情况

14.linux命令使用多吗

15.linux如何看磁盘使用情况

16.数仓任务依赖中如何处理逆向依赖问题

17.元数据血缘关系是如何解析的

18.数据治理中,任务的数据倾斜是如何判断的

19.两个表字段:

表t1字段为用户id,用户姓名:

id,name

1,小王

2,小张

表t2字段为用户id,去过的城市:

id,city

1,bj

1,shanghai

2,shenzhen

求:查询没有去过北京的的人的名字。

代码语言:javascript
复制
select a.id,
       a.name
  from (
        select id,
               name
          from (
                select 1 as id,
                       '小王' as name
             union all select 2 as id,
                       '小张' as name
               ) t1
       ) a
  left join (
        select id
          from (
                select 1 as id,
                       'bj' as city
             union all select 1 as id,
                       'shanghai' as city
             union all select 2 as id,
                       'shenzhen' as city
               ) t2
         where city = 'bj'
         group by 1
       ) b
    on a.id = b.id
 where b.id is null

20.表a两个字段:dt,dau

求:每一天求最近平均三天的dau。

代码语言:javascript
复制
select
    date_add(dt, 2),
    s_dau/3
from(
        select dt,
               dau,
               rank() over(order by dt desc) rn,
               sum(dau) over(order by dt desc) s_dau
          from (
                select '2021-01-01' as dt,
                       1 as dau
             union all select '2021-01-02' as dt,
                       4 as dau
             union all select '2021-01-03' as dt,
                       2 as dau
             union all select '2021-01-04' as dt,
                       3 as dau
             union all select '2021-01-05' as dt,
                       6 as dau
             union all select '2021-01-06' as dt,
                       5 as dau
             union all select '2021-01-07' as dt,
                       7 as dau
               ) a
         group by dt,
                  dau) t
                  where rn % 3 = 0
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-10-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据与知识图谱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档