腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据仓库技术
专栏作者
举报
55
文章
13977
阅读量
15
订阅数
订阅专栏
申请加入专栏
全部文章(55)
数据(39)
函数(24)
sql(18)
大数据(18)
面试(18)
select(12)
排序(11)
time(10)
统计(10)
登录(9)
date(8)
hive(7)
字符串(5)
join(4)
row(4)
数据分析(3)
friend(3)
测试(3)
模型(3)
日志(3)
hadoop(2)
rank(2)
view(2)
部署(2)
基础(2)
解决方案(2)
配置(2)
数据仓库(2)
数据类型(2)
数组(2)
语法(2)
access(1)
搜索引擎(1)
unix(1)
企业(1)
微信(1)
安全(1)
apple(1)
click(1)
code(1)
dt(1)
explode(1)
gpt(1)
ip(1)
lag(1)
mac(1)
min(1)
partition(1)
pear(1)
pool(1)
product(1)
stock(1)
sum(1)
timestamp(1)
union(1)
编译(1)
翻译(1)
服务器(1)
工作(1)
管理(1)
环境搭建(1)
技巧(1)
集群(1)
可视化(1)
内存(1)
软件(1)
实践(1)
事件(1)
数学(1)
搜索(1)
异常(1)
主机(1)
搜索文章
搜索
搜索
关闭
三一重工大数据面试SQL-部门人员数据分析
sql
大数据
数据分析
面试
数据
现有一张员工在职所在部门信息表,包含员工ID、所属部门、开始日期、结束日期,请查询出如下内容
数据仓库晨曦
2024-04-30
60
0
字节快手大数据面试SQL-最高峰同时直播人数
面试
数据
sql
大数据
time
有如下数据记录直播平台主播上播及下播时间,根据该数据计算出平台最高峰同时直播人数。
数据仓库晨曦
2024-04-30
66
0
大数据面试SQL048-泳池问题(下)
大数据
pool
time
面试
数据
我们接着上两题继续讨论泳池问题,还是相同的数据。现有一份数据记录了用户进入和离开游泳池的时间,请计算出泳池内的平均人数
数据仓库晨曦
2024-04-11
47
0
大数据面试SQL047-泳池问题(中)
面试
数据
大数据
time
函数
我们接着上一题大数据面试SQL046-泳池问题(上)继续讨论泳池问题。现有一份数据记录了用户进入和离开游泳池的时间,请找出一天中泳池最多人数持续时长,如有出现多次最高人数,对时间求和
数据仓库晨曦
2024-04-11
54
0
大数据面试SQL046-泳池问题(上)
日志
数据
数据仓库
大数据
面试
这个题目是根据日志内容,计算时点状态数据,类似的还有根据日志计算直播间用户人数、游戏同时在线人数等。考察内容为累积求和及其使用技巧,属于知识面和经验的考察,如果知道则十分简单。
数据仓库晨曦
2024-04-11
81
0
数据仓库的核心概念
事件
数据
数据仓库
企业
模型
数据仓库晨曦
2024-03-25
92
0
大数据面试SQL045-每个用户每月访问次数占比及累积占比
函数
面试
数据
统计
大数据
接上一道题目大数据面试SQL044-统计每个用户累计访问次数我们再进一步探查sum()聚合函数使用over()开窗后有order by和没有order by的区别。
数据仓库晨曦
2024-03-25
80
0
大数据面试SQL044-统计每个用户累计访问次数
数据
统计
大数据
函数
面试
有如下用户访问数据t_visit_stat_044,包含用户ID(user_id),访问日期(visit_date),当天访问次数(visit_cnt)
数据仓库晨曦
2024-03-25
91
0
数据分析02-数据抽样
数据分析
select
函数
排序
数据
有数据表t_sample包含ID,type,val三个字段1~10000行数据,type为随机分配的1~3,val为0~1的随机数;其中根据ID进行分10个桶;
数据仓库晨曦
2024-03-07
126
0
数据分析01-数据分箱
数据分析
min
select
数据
统计
样例数据:我们创建一张hive表 t_box,包含两列(id,val), 其中id为1~1000,val 为随机数浮点数。
数据仓库晨曦
2024-03-06
139
0
通过ollama+open webui可视化运行gemma
内存
部署
管理
可视化
模型
ollama是专为在Docker容器中部署LLM而设计的,简化了部署和管理流程,目前它支持的模型如下:
数据仓库晨曦
2024-03-06
4.9K
0
GPT替代搜索引擎实践
翻译
工作
实践
搜索引擎
gpt
从去年chat-gpt3.5发布后,就开始尝试使用了。那个时候大家都在担心gpt是否会替代人们的工作,于是我写了chatGPT能取代写SQL的工作吗? 当时结论是:我不认为未来几年内chatGPT或者其他LLM会直接替换掉数据开发人员的工作,仅仅是写SQL也不行。 chatGPT不能直接替换掉数据开发人员的工作,但是它却是一个十分强大的工具,可以数倍的提升工作效率,也就意味着当前一个团队的工作可能在未来只需要一个人就能完成,留下的应该是chatGPT玩得飞起的那个人吧。 经过一年多的时间,chat-GPT升级到了4.0,各种大模型层出不穷。我也尝试了不少的产品,现在主要使用的是kimichat,https://kimi.moonshot.cn/ 其大概替代掉了我日常30%~50%的搜索引擎场景。
数据仓库晨曦
2024-03-06
82
0
Hive基础知识07-求取中位数
异常
hive
函数
排序
数据
中位数(Median)是描述一个数据集中心位置的统计量,它是将数据集从小到大排序后位于中间位置的数值。如果数据集中的元素数量是奇数,那么中位数就是正中间的那个数;如果是偶数,中位数则是中间两个数的平均值。
数据仓库晨曦
2024-03-06
325
0
大数据面试SQL043-计算出完成订单数的众数
数据
统计
大数据
rank
面试
众数是描述数据集中趋势的一种方式,它特别适用于分类数据和顺序数据。在实际应用中,众数可以帮助我们了解数据的集中趋势,尤其是在数据分布不均匀时。
数据仓库晨曦
2024-02-28
163
0
大数据面试SQL042-所有考试科目的成绩都大于对应学科的平均成绩的学生
大数据
函数
技巧
面试
数据
2)查询出“所有”科目都大于平均成绩的学生,这里的所有比较难处理,有个技巧:对每个学生的每个科目满足“成绩>科目平均成绩”的记录打0,不满足的打1,然后对学生所有科目标签求和,和为0则满足“所有科目都大于平均成绩”,和>0则不满足;
数据仓库晨曦
2024-02-27
120
0
大数据面试SQL035-用户行为路径分析
大数据
dt
time
面试
字符串
有一张用户操作行为记录表 t_act_log_035 包含用户ID(user_id),操作编号(op_id),操作时间(op_time)
数据仓库晨曦
2024-02-27
130
2
大数据 面试 SQL 041 按照顺序进行行转列拼接
sql
大数据
面试
数据
字符串
今天这个题目来自群里的小伙伴考我的:已知有表中含有两列数据id,val,数据内容如下,请按照id的大小将val进行拼接。
数据仓库晨曦
2024-01-08
133
0
大数据 面试 SQL 040 计算次日留存率
sql
大数据
date
登录
面试
现有用户登录记录表,已经按照用户日期进行去重处理。以用户登录的最早日期作为新增日期,请计算次日留存率是多少。
数据仓库晨曦
2024-01-08
197
0
大数据面试SQL038 用户连续登录所有断点日期(二)
大数据
date
登录
面试
数据
038题目发出后,群里很多朋友发出各种疑问,也给出了很多写法。大家的疑问主要有两个
数据仓库晨曦
2024-01-08
164
2
大数据面试SQL 039 连续登录三天的记录
sql
大数据
date
登录
面试
现有用户登录记录表,已经按照用户日期进行去重处理。请查询出用户所有连续三天登录的数据记录
数据仓库晨曦
2024-01-08
155
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档