首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我为NET狂官方面试题-数据库篇

请用一句SQL获取最后更新的事务号(ID) 有如下两个表: ①请查询11 ~ 15记录的User ②查询用户类型type=1积分排名前十的user ③写一条存储过程,实现往User中插入一条记录并返回当前...UserId(自增长id) 请求出每个班级的数学平均分,并按照高低进行排序 一个TestDB表有A,B两个字段。...(最好用两种方法) 表中有A,B,C三列,用SQL实现:当A列>B列选择A,否则选择B,当B列>C列选择B,否则选择C 数据行列互换 转换前: 转换后: 请统计每个URL访问次数并按访问次数由高到低的顺序排序...用户注册表中id是自增长的,①请查询出一天24h每小时注册的人数②请查询第4条记录③请查询ID重复次数大于2次的记录 图书表(图书号,图书名,作者编号,出版社,出版日期)作者表(作者编号,作者姓名,年龄...用SQL语句查询出年龄小于平均年龄的作者名称、图书名,出版社 返回num最小的记录(禁止使用min,max等统计函数) 举例说下项目中视图的好处? SQLServer有哪些系统数据库?

78490

Python数据分析案例-药店销售数据分析

把切割后的日期转为时间格式,方便后面的数据统计: ''' #errors='coerce' 如果原始数据不符合日期的格式,转换后的值为空值NaT dataDF.loc[:,'销售时间']=pd.to_datetime...(1)业务指标1:月均消费次数 月均消费次数 = 消费次数 / 月份数(同一天内,同一个人所有消费算作一次消费) #计算消费次数 #删除重复数据 kpil_Df = dataDF.drop_duplicates...(subset=['销售时间','社保卡号']) totalI = kpil_Df.shape[0] print('消费次数=',totalI) #计算月份数 #按销售时间升序排序 kpil_Df.../ 消费次数 #客单价 pct = totalMoneyF / totalI print('业务指标3:客单价=', pct) (4)消费趋势 a....分析药品销售情况 对“商品名称”和“销售数量”这两列数据进行聚合为Series形式,方便后面统计并按降序排序: #聚合统计各种药品数量 medicine = groupDF[['商品名称','销售数量

1.8K21
您找到你想要的搜索结果了吗?
是的
没有找到

面试现场!月薪3w+的这些数据挖掘SQL面试题你都掌握了吗? ⛵

我们知道,每位顾客每次光顾,都会生成 sales 中的相关记录,我们可以基customer_id统计客户访问餐厅的不同日期。...这里很显然是以『菜』为核心,因此我们会基于product_id进行分组,同时我们需要统计的是购买了多少次,因此需要根据count(product_id)的结果进行排序,对应的SQL如下所示:SELECT...在这个问题中,我们要对客户购买每种产品的次数进行排名,因此使用窗口函数 rank,按customer_id划分,按客户购买产品的次数(计数)排序。...使用窗口函数通过对customer_id进行划分并按order_date 对其进行排序,可以实现对第一个购买日期进行排序。这里依旧会需要借助临时表view_tab。...要查询客户在成为会员之前购买的商品,订单日期需要小于加入日期。使用窗口函数通过对customer_id进行划分并按order_date对其进行排序,对第一个购买日期进行降序排列。

52051

19个超赞的数据科学和机器学习工具,编程小白必看!(附资料)

RapidMiner 链接: https://rapidminer.com/ 介绍视频: https://www.youtube.com/embed/ma14K56fNAM?...目前的产品包括以下内容: RapidMiner Studio:一款可用于数据准备、可视化和统计建模的独立软件。...Paxata平台遵循以下流程: 添加日期:使用广泛的来源获取数据。 探查:使用强大的视觉效果进行数据探查,使用户可以轻松识别数据中的空白。...它将数据作为输入并按列提供各种统计数据的摘要。另外,对于每一列,它都会自动推荐一些可以通过单击进行选择的转换。可以使用一些预先定义的函数对数据执行各种转换,这些函数可以在界面中轻松调用。...在训练过程中,有解释模型以及用于实时特征重要性排序的面板的强大功能。 10.

75230

简单五步:利用Gitstats给代码仓库做一次体检

作者数:列举所有的作者(提交数,第一次提交日期,最近一次的提交日期),并按月和年来划分。 文件数:按日期划分,按扩展名名划分。 行数:按日期划分。...维度 描述 Commits by Year 全年统计汇总 Commits by year/month 每月统计汇总 Month of Year 每月统计汇总 Hour of Week 每星期按时统计汇总...Day of Week 每星期按日统计汇总 Hour of Day 每天按时统计汇总 Weekly activity 每周统计汇总 Commits by Timezone 时区统计汇总 3、用户提交维度的数据统计...维度 描述 List of Authors 作者提交列表汇总 Cumulated Added Lines of Code per Author 作者提交行数汇总 Commits per Author...作者提交次数汇总 Author of Month 每月作者提交汇总 Author of Year 每年作者提交汇总 Commits by Domains 提交方式汇总 4、文件类型提交维度的数据统计

2.4K20

pandas实战:用户消费行为画像

order_product:订单产品 order_amount:订单金额 1.统计每个客户购买的总数量和平均金额 使用groupby+agg聚合的方法得到统计结果,并按order_product降序排序...5.复购率分析 复购率定义:在一个月内消费次数2次及以上的用户所占的比例。...首先通过透视表pivot_table统计每个用户各月的消费次数,然后加工出复购的标识,将每月消费次数2次以上的记为1,一次的记为0,没有消费的记为NaN。...客户分层分析 根据客户的活跃程度可将客户分为沉默户、新户、活跃户、不活跃户、回流用户,具体定义如下: 沉默户:从未发生过消费的客户 新户:第一次消费的客户 活跃户:老客户,在时间窗口内发生过消费的客户...通过分组内偏移、排序、累计求和等方法实现。分组内的各种骚操作可以了解东哥的pandas进阶宝典。

21010

疫情这么严重,还不待家里学Numpy和Pandas?

='coerce' 如果原始数据不符合日期的格式,转换后的值为控制NaT #format 是你原始数据中的日期的格式 salesDf.loc[:,'销售时间']=pd.to_datatime(salesDf.loc...[:,'销售时间'], formate='%y-%m-%d', errors='coerce') 4.数据排序 by:按哪几行排序 ascending=true 表示升序排序 na-position='...=消费次数 / 月份数 kpilDf=salesDf.drop_duplicates( subset=['销售时间','社保卡号'] ) #消费次数:有多少行 totalI=kpi1_Df.shape...=消费次数 / 月份数 kpil_i=tatali//monthi #指标2:月均消费金额 = 消费金额 / 月份数 #消费金额 totalMoneyF=salesDf.loc[:,‘实收金额’...].sum() #月均消费金额 monthMoneyF=totalMoneyF/monthsi #指标3:客单价=消费金额 / 消费次数 pct=totalMoneyF/totali 打了这么多代码做个总结

2.5K41

Oracle分析函数二——函数用法

并按order by的值(hire_date)进行累计统计 --Partition by Order by首先按相应的值(manager_id,hire_date)排序并按order by的值(hire_date...,hire_date)排序并按order by的值(hire_date)进行累计统计 --该平均值由当前员工和与之具有相同经理的前一个和后两个三者的平均数得来 SELECT manager_id...为取值范围,估计只有数字和日期能够进行取值了 --Partition by Order by首先按相应的值(manager_id,hire_date)排序并按order by的值(hire_date)...进行累计统计 --该平均值由当前员工和与之具有相同经理,并且雇用时间在该员工时间之前的50天以内和在该员工之后的150天之内员工的薪水的平均值 --range为取值范围,估计只有数字和日期能够进行取值了...首先按相应的值(manager_id,hire_date)排序并按order by的值(hire_date)进行累计统计 --该平均值由当前员工和与之具有相同经理的平均值 --每行对应的数据窗口是从第一行到最后一行

49110

面试学习:海量数据的数据结构思想与算法

分而治之(hash映射)+hashmap统计数量+堆排、快排、归并排序等 海量日志数据,提取出某日访问百度次数最多的那个IP 如一亿个Ip求Top 10,可先%1000将ip分到1000个小文件中去,并保证一种...ip只出现在一个文件中,再对每个小文件中的ip进行hashmap计数统计并按数量排序,最后归并或者最小堆依次处理每个小文件的top10以得到最后的结果。...尽管数据映射到了另外一些不同的位置,但数据还是原来的数据,只是代替和表示这些原始数据的形式发生了变化而已。...直接上hash统计,然后排序。So,针对此类典型的TOP K问题,采取的对策往往是:hashmap + 堆。如下所示: hash_map统计:先对这批海量数据预处理。...最终我们在O(N)的时间复杂度内用Hash表完成了统计;  堆排序:第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。

5010

CSDN是怎么实现用户签到,统计签到次数,连续签到天数等功能微服务的

文章目录 需求分析 设计思路 用户签到和统计连续签到的次数 签到控制层 SignController 签到业务逻辑层 SignService 测试 按月统计用户签到的次数 签到控制层 SignController...(如2022-12-19) amount 连续签到天数(如19) 用户签到:往此表插入一条数据,并更新连续签到天数; 查询根据签到日期查询 统计根据 amount 统计 如果这样存数据的话,对于用户量比较大的应用...用户签到和统计连续签到的次数 用户签到,默认是当天,但可以通过传入日期补签,返回用户连续签到次数(后续如果有积分规则,就会返回用户此次签到积分) 签到控制层 SignController /**...按月统计用户签到的次数 用户需求:统计某月签到次数,默认是当月 签到控制层 SignController /** * 获取签到次数 默认当月 * * @param...查询当月签到天数为5天: 获取用户签到明细情况 获取用户某月签到情况,默认当前月,返回当前月的所有日期以及该日期的签到情况 签到控制层 SignController /** *

2.1K20

MySQL练习题

要求采用别名显示字段:账户名,交易类型,交易金额,交易时间 ​ 提示:使用表连接、order by排序、limit 7) 使用别名统计交易表每个卡号对应的存入次数和最大存入金额且要求最大存入金额大于1000...,并按订单数量降序排序,显示商品名,订单数量. ​...提示:使用表联接、分组查询、聚合函数 9)–统计每个下单日期的销售总额,按销售总额升序排列。 ​...,并按订单数量降序排序,显示商品名,订单数量. -- 提示:使用表联接、分组查询、聚合函数 select GoodName 商品名,count(*) 订单数量 from t_goods t1,t_orders...t2 where t2.GoodId=t1.GoodId group by GoodName order by 订单数量 desc; /* 统计每个下单日期的销售总额,按销售总额升序排列。

1.4K20

获取 nginx 日志中请求 IP 统计数,设置 IP 流量限制

日志中访问IP的统计并按照访问数量高到低排序,显示前50个IP: awk '{print $1}' /path/to/nginx/access.log | sort | uniq -c | sort...sort:将提取的IP地址进行排序。 uniq -c:统计每个唯一的IP地址出现的次数,并在前面显示计数。 sort -nr:按照计数值进行逆序排序,从高到低排列。...运行该命令后,您将得到一个按访问数量排序的IP地址列表,显示了每个IP地址在访问日志中出现的次数。注意,您需要替换日志文件路径以正确指向Nginx访问日志文件。...运行该命令后,您将得到按访问数量排序的IP地址列表,显示了每个IP地址在解压缩后的访问日志中出现的次数。...脚本会使用while循环从开始日期迭代到结束日期,根据日期构建每个日志文件的路径。然后,它会检查文件是否存在,如果存在,则执行与之前相同的统计命令来处理该日志文件。

87820

MySQL之数据库基本查询语句

select * from Article order by convert(type using gbk); SELECT grop by子句 对条件进行分组排序 #分别统计coco和vivi的文章数...5; with rollup实现在分组统计数据基础上再进行统计 #将Article按author进行分组,再统计每个人的文章数 select author,sum(articles) as '文章数...查询姓名中有*的学生信息 select * from Article where type regexp '\\*'; SELECT 使用函数处理数据 concat()函数拼接 #将类型和对应的qq群连接起来,并按类型排序...#获取系统当前日期时间 年-月-日 时:分:秒 select sysdate(); #获取系统当前日期 年-月-日 select curdate(); #获取系统当前时间 时:分:秒 select...curtime(); #获取给定日期的年份——获取当前系统时间的年份 select year(CURDATE()); #获取给定日期的月份——获取当前系统时间的月份 select month(CURDATE

4.8K40

大数据面试吹牛草稿V2.0

、点赞的次数、收藏的次数等等,将他们组合成为 DWS 层每天发生的事情。...DWS 层最大的行为宽表是用户行为宽表,其字段有互动日期、用户 id、用户昵称、注册日期、注册来源、细分渠道、注册省份、评论次数、打赏次数、添加收藏、取消收藏、关注商品、取消关注的商品、关注人、取消关注的人...“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、金额等),例如,订单事件中的下单金额。...+----+-----------+ | 7 | Jonathan | +----+-----------+ 思路: 去重:由于每个人可能一天可能不止登陆一次,需要去重 排序:对每个 ID 的登录日期排序...X 天; 如何找连续日期:通过排序与登录日期之间的差值,因为排序连续,因此若登录日期连续,则差值一致; GROUP BY 和 HAVING 的应用:通过 id 和差值的 GROUP BY,用 COUNT

56431

数据科学家成长指南(下)

既有文本数据,数值数据,也有时间日期数据。哪怕同一类,如时间日期,也会因为时区的不同而有差异。 对数据格式的了解有助于后续工作的开展。...非规范数据,如果大平台没有统一的数据标准和数据字典,数据会有不规范的情况发生。比如有些表,1代表男人,0代表女人,而有些表则反过来,也可能是上海和上海市这类问题。...Binning Sparse Values 分箱稀疏值,两个合起来我不知道具体意思 分箱是一种常见的数据清洗方法,首先是将数据排序并且分隔到一些相等深度的桶(bucket)中,然后根据桶的均值、中间值...将抽样单位以某种特征或者规律划分成不同的层,然后从不同的层中抽样,最后结合起来作为样本。 为什么需要分层抽样?如果整群符合随机性倒还好,如果不是会造成统计上的误差。...RapidMiner是一个开源的数据挖掘软件,提供一些可扩展的数据分析挖掘算法的实现。

71120

Linux日志审计中的常用命令: sed、sort、uniq

`sed`用于文本处理,如替换、删除、插入操作;`sort`用于文本排序,支持数字顺序、反向排序等;`uniq`用于去重和统计重复次数。...文章通过实例展示了如何结合这些命令来分析和统计日志数据,如统计网站访问日志中每个IP的访问次数排序。这些命令的熟练使用可以提高日志分析和处理的效率,对于实现复杂的日志审计和分析任务至关重要。...例如,去重并按第三列的数字顺序排序: sort -u -n -k 3 data.txt 3. uniq命令 uniq命令用于去重和统计重复次数。...现在我们要统计每个IP的访问次数并按访问次数从高到低排序。...命令对IP地址进行排序 使用uniq -c统计每个IP出现的次数 使用sort -nr按访问次数从高到低排序 通过这个例子,我们可以看到sed、sort和uniq命令的组合使用,可以快速地分析和统计日志数据

13610

shell脚本 mysql-binlog分析

一.简介 介绍 分析binlog工具,现有功能: 基于业务表分析统计各个表的dml的次数。 各个业务表的最后访问时间。 各dml次数。 该binlog的事务总数。...当指定detail的时候结果较为详细, 会打印详细的分析过程, 消耗时间也不直观, simple只做了统计工作 -s : 指定排序规则, 供选选项有”insert|update|delete”....默认会把统计结果做一个排序, 按照表的维度统计出insert update delete的次数, 并按次数大小排序(默认insert) 注: 其他参数使用请参见帮助手册 bash analysis_binlog..., 然后按照update的次数排序, Last Time表示该表的最后一次操作 cat mysql-bin.000798.res 使用测试-2 1.binlog to sql 根据需求执行 —binlog2sql...,可选的方式是两种,一是统计sql的个数,二统计事务的个数,默认是统计sql的个数。

1.5K01

一个Oracle小白的AWR报告分析(三)

等待事件统计主要包括以下信息: 时间模式统计 操作系统统计 操作系统统计详细信息 前台等待类 前台等待事件...服务等待类统计 首先看一下Time Model Statistics,此处已经按时间做了排序了 DB time=117340.62秒,24核CPU,所以DB time %=117340.62...time 硬解释SQL的时间 failed parse elapsed time 解释SQL失败的时间 说实在的单纯看时间和比例,是无法准确定位的。...主要问题集中在direct path read,db file sequential red的等待次数,但是这两个指标的等待时长不算长; direct path read这个等待事件发生在会话将数据块直接读取到...当发生direct path read等待事件时,意味着磁盘上有大量的临时数据产生,比如排序、并行执行等操作,或者意味着PGA中空闲空间不足。

95320
领券