首页
学习
活动
专区
工具
TVP
发布

数据仓库技术

专栏成员
63
文章
17444
阅读量
15
订阅数
字节华为大数据面试SQL-合并日期重叠的活动
已知有表记录了每个大厅的活动开始日期和结束日期,每个大厅可以有多个活动。请编写一个SQL查询合并在同一个大厅举行的所有重叠的活动,如果两个活动至少有一天相同,那他们就是重叠的
数据仓库晨曦
2024-05-27
730
小红书大数据面试SQL-用户商品购买收藏行为特征加工
购买记录表t_order,包含自增id:id,用户ID:user_id,商品ID:goods_id,订单时间:order_time,商品类别:goods_type;
数据仓库晨曦
2024-05-27
490
字节百度大数据面试SQL-股票波峰波谷
有如下数据,记录每天每只股票的收盘价格,请查出每只股票的波峰和波谷的日期和价格; 波峰:股票价格高于前一天和后一天价格时为波峰 波谷:股票价格低于前一天和后一天价格是为波谷
数据仓库晨曦
2024-05-27
610
京东大数据面试SQL-合并数据
首先题目虽然给出了最终期望结果,但描述实在不够清晰,所以我给题目清晰度打分3⭐️。这里我对题目进行进一步描述
数据仓库晨曦
2024-05-18
1120
快手大数据面试SQL-互相关注(三种解法)
现有关注表 t_follow,包含from_user:关注者,to_user:被关注者。如果两个用户互相关注,则代表他们是好友,请找出是好友的关系对;
数据仓库晨曦
2024-05-18
1240
滴滴大数据面试SQL-取出累计值与1000差值最小的记录
已知有表t_cost_detail包含id和money两列,id为自增,请累加计算money值,并求出累加值与1000差值最小的记录。
数据仓库晨曦
2024-05-18
910
美团字节大数据面试SQL-每分钟最大直播人数
有如下数据记录直播平台主播上播及下播时间,根据该数据计算出平台每分钟最大直播人数。
数据仓库晨曦
2024-05-18
1020
小红书大数据面试SQL-品牌营销活动天数
有营销活动记录表,记录了每个品牌每次营销活动的开始日期和营销活动的结束日期,现需要统计出每个品牌的总营销天数。
数据仓库晨曦
2024-05-18
720
三一重工大数据面试SQL-部门人员数据分析
现有一张员工在职所在部门信息表,包含员工ID、所属部门、开始日期、结束日期,请查询出如下内容
数据仓库晨曦
2024-04-30
830
字节快手大数据面试SQL-最高峰同时直播人数
有如下数据记录直播平台主播上播及下播时间,根据该数据计算出平台最高峰同时直播人数。
数据仓库晨曦
2024-04-30
830
大数据面试SQL048-泳池问题(下)
我们接着上两题继续讨论泳池问题,还是相同的数据。现有一份数据记录了用户进入和离开游泳池的时间,请计算出泳池内的平均人数
数据仓库晨曦
2024-04-11
580
大数据面试SQL047-泳池问题(中)
我们接着上一题大数据面试SQL046-泳池问题(上)继续讨论泳池问题。现有一份数据记录了用户进入和离开游泳池的时间,请找出一天中泳池最多人数持续时长,如有出现多次最高人数,对时间求和
数据仓库晨曦
2024-04-11
650
大数据面试SQL046-泳池问题(上)
这个题目是根据日志内容,计算时点状态数据,类似的还有根据日志计算直播间用户人数、游戏同时在线人数等。考察内容为累积求和及其使用技巧,属于知识面和经验的考察,如果知道则十分简单。
数据仓库晨曦
2024-04-11
940
数据仓库的核心概念
数据仓库晨曦
2024-03-25
990
大数据面试SQL045-每个用户每月访问次数占比及累积占比
接上一道题目大数据面试SQL044-统计每个用户累计访问次数我们再进一步探查sum()聚合函数使用over()开窗后有order by和没有order by的区别。
数据仓库晨曦
2024-03-25
990
大数据面试SQL044-统计每个用户累计访问次数
有如下用户访问数据t_visit_stat_044,包含用户ID(user_id),访问日期(visit_date),当天访问次数(visit_cnt)
数据仓库晨曦
2024-03-25
1250
数据分析02-数据抽样
有数据表t_sample包含ID,type,val三个字段1~10000行数据,type为随机分配的1~3,val为0~1的随机数;其中根据ID进行分10个桶;
数据仓库晨曦
2024-03-07
1320
数据分析01-数据分箱
样例数据:我们创建一张hive表 t_box,包含两列(id,val), 其中id为1~1000,val 为随机数浮点数。
数据仓库晨曦
2024-03-06
1680
通过ollama+open webui可视化运行gemma
ollama是专为在Docker容器中部署LLM而设计的,简化了部署和管理流程,目前它支持的模型如下:
数据仓库晨曦
2024-03-06
5.5K0
GPT替代搜索引擎实践
从去年chat-gpt3.5发布后,就开始尝试使用了。那个时候大家都在担心gpt是否会替代人们的工作,于是我写了chatGPT能取代写SQL的工作吗? 当时结论是:我不认为未来几年内chatGPT或者其他LLM会直接替换掉数据开发人员的工作,仅仅是写SQL也不行。 chatGPT不能直接替换掉数据开发人员的工作,但是它却是一个十分强大的工具,可以数倍的提升工作效率,也就意味着当前一个团队的工作可能在未来只需要一个人就能完成,留下的应该是chatGPT玩得飞起的那个人吧。 经过一年多的时间,chat-GPT升级到了4.0,各种大模型层出不穷。我也尝试了不少的产品,现在主要使用的是kimichat,https://kimi.moonshot.cn/ 其大概替代掉了我日常30%~50%的搜索引擎场景。
数据仓库晨曦
2024-03-06
950
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档