首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

抖音面试题:送你一个万能模板,要吗?

窗口函数 窗口函数lead使用方法: image.png 默认是指:当向上N行或者向下N行时,如果已经超出了表行和范围时,会将这个默认作为函数返回,若没有指定默认,则返回Null。...窗口函数lead可以获取每个字段后面的第n个,并生成新。 而这道题描述“用户连续登陆”中“连续”可以理解用户当前登陆日期与本月下一次登陆日期相差一天。...结果看,我们可以获得以下信息: 1)当“日期”与“用户当月下一个登陆日期”只相差一天,即用户本次登陆连续登陆; 2)当“日期”与“用户当月下一个登陆日期”相差大于一天,即用户本次登陆连续登陆最后一天...将这两种情况过滤出来之后,用户连续登陆天数:当前登陆顺序减去上一个登陆顺序。...image.png image.png 【本题考点】 1.考查对窗口函数了解,要把《猴子 零学会SQL》里讲过窗口函数能解决4类面试题要记住; 2.考查对子查询了解; 3.考查对连续问题了解

1K00

【Python常用函数】一文让你彻底掌握Python中toad.selection.select函数

target:目标或因变量。 empty:缺失个数超过该阈值时删除变量,若小于1,则变量缺失率高于该阈值时删除变量。 iv:删除iv低于该阈值变量。...三、select函数实例 1 导入库并加载数据 背景:需分析7252个客户多头、关联风险、法院执行、风险名单和逾期信息,用于构建客户贷前评分卡A卡。...', '申请状态', '历史最高逾期天数.x', '历史最高逾期天数.y'] # 去掉多余,只保留自变量和因变量 date_f = date.drop(columns=drop_columns) date_f.shape...如果把return_drop=True改成False,则不会返回drop_lst,这个可以根据需要进行设置。...为了验证删除iv低于0.05变量是否真的3个,可以运行如下代码: toad.quality(date_f,'y',iv_only=True).tail(15) 得到结果: 可以发现iv低于0.05

1.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

抖音面试题:遇到连续问题怎么办?

窗口函数 窗口函数lead使用方法: lead(字段名,N,默认) over(partion by …order by …) 默认是指:当向上N行或者向下N行时,如果已经超出了表行和范围时,会将这个默认作为函数返回...窗口函数lead可以获取每个字段后面的第n个,并生成新。 而这道题描述“用户连续登陆”中“连续”可以理解用户当前登陆日期与本月下一次登陆日期相差一天。...结果看,我们可以获得以下信息: 1)当“日期”与“用户当月下一个登陆日期”只相差一天,即用户本次登陆连续登陆; 2)当“日期”与“用户当月下一个登陆日期”相差大于一天,即用户本次登陆连续登陆最后一天...这样,可以判断用户连续登陆情况。 接下来就解决用户每次连续登陆天数计算。 3....将这两种情况过滤出来之后,用户连续登陆天数:当前登陆顺序减去上一个登陆顺序。

1K20

使用 bash 倒计时日期方法

date 命令 %j 选项将以 1 至 366 之间数字显示当前日期。如你所想一样,1 月 1 日将显示 1,12 月 31 日将显示 365 或 366,这取决于是否是闰年。继续尝试。...如果结果是正数,我们将显示剩余天数。如果零,则发出 “Merry Christmas” 消息,如果负,那么仅告诉运行脚本的人他们错过了假期。也许他们沉迷在蛋酒中了。...实际上,我们可以要求运行脚本的人员提供日期,然后让他们知道在到那天还有多少天。这个脚本是这样。 #!...即使他们输入日期时提供了年,date -d 命令仍将仅提供今年中天数,而不会提供在到那时天数。 计算从今天到某年日期之间天数可能有些棘手。你需要包括所有中间年份,并注意那些闰年。...使用 Unix 纪元时间 计算在到某个特殊日期之间天数另一种方法是利用 Unix 系统存储日期方法。

1.2K32

如何使用笔记软件 FlowUs、Notion 进行间隔重复?基于公式模版

数据说明 Last Date: 最近复习日期。选择日期属性。 Next Date:下一次复习日期。选择公式属性。...根据你对单词熟悉程度,选择合适间隔天数。...每次复习单词时候,在 Last Date ,选择当天时间。 随后,根据公式,便会生成下一次需要复习时间。 根据时间,设置日期提醒。或者使用筛选功能筛选时间范围,进行查看和复习。...具体如下: Level 对需要复习内容进行评级。从公式可以看到,不同级别的内容,所需要间隔重复天数不一样。...如图,我图中单词设定了相同最近复习时间,由于级别的不同,导致下一次复习时间并不相同。

71830

【Python数据挖掘】应用toad包中KS_bucket函数统计好坏样本率、KS

一、安装toad包 首先打开cmd,安装toad包,安装语句如下: pip install toad 若安装成功,会显示结果如下: 二、导入数据 背景:需分析7252个客户多头、关联风险、法院执行...return_splits:是否返回分箱分割点,如果等于True则返回,否则不返回,默认不返回。...=True,所以该语句得到一个元组,元组第一个数据是包含区间、好坏样本数量、占比、KS等信息数据框,第二个数据是分箱分割点。...max展示分箱区间右端点。 bads统计对应分箱中坏样本数量。 goods统计对应分箱中好样本数量。 total统计对应分箱中总计样本数量。..., '申请状态', '历史最高逾期天数.x', '原始分', '历史最高逾期天数.y', 'y', 'Ratio', '7天内申请人在多个平台申请借款', '1个月内申请人在多个平台申请借款

1.5K10

Python批量处理Excel数据后,导入SQL Server

首先我们要判断空,然后设置日期天数计算起始时间,利用datetime模块timedelta函数将时间天数转变成时间差,然后直接与起始日期进行运算即可得出其代表日期。.../1/6 # 推算出 excel 天数转短日期 是1899.12.30开始计算 start = date(1899,12,30) # 将days转换成 timedelta 类型...,不过想明白后,其实也好算,excel中我们可以直接将日期天数转成短日期,等式已经有了,只有一个未知数x,我们只需一个一元一次方程即可解出未知数x。...我想法是,首先调用pandassort_values函数将所有数据根据日期进行升序排序,然后,调用drop_duplicates函数指定按SOID进行去重,并指定keeplast,表示重复数据中保留最后一行数据...代码如下: # 去除重复 SOID重复 按日期去除最早数据 def delete_repeat(data): # 先按日期 Docket Rec.Date & Time 排序 默认降序

4.6K30

活动、节假日、促销等营销方式因果效应评估——特征工程篇(一)

这个特征和上一个特征是一样,只不过计算是上一周各个特征,作者想查看前一周销量各个特征; 时间窗口内(最近7/14/30/60/140天): - 有销量/促销天数,分别查看时间窗口内有销量和促销天数...,以时间窗口3天例,如果这三天都有销量,那么3; - 距离上次有销量/促销天数,以时间窗口3天例,上一次有销量是昨天,那么该1。...这个特征主要是查看上一次有销量或者促销对未来商品销量影响,以促销例,有些商品近期才做过促销,可能未来几天销量就会受影响; - 距离最早有销量/促销天数,以时间窗口3天例,最早有销量是最近第三天...,那么该3; - 时间窗口内(后15天)促销天数、距离上次促销天数、距离最早促销天数,这个特征和上一个特征类似,只不过查看未来15天各个特征情况; - 时间窗口内(最近15天)当天销量; -...s2时去掉了一些节日 放弃了6月,因为分析数据得知618出流量异常,同时我们也用了去除流量异常节日,发现效果不佳。

3.4K42

利用Python统计连续登录N天或以上用户

但是我们需要统计时间单位是以日周期,故而这里可以先做简单去掉时间部分处理方式 采用字符串split方法,按照‘ ’(空格)进行切片,取第一部分即可 #因为日期数据为时间格式,可以简单使用字符串按照空格切片后取第一部分...删除日志里重复数据(同一天玩家可以登录多次,故而只需要保留一条即可) 我们看到上面处理过数据,可以发现role_id570837202用户在1月8日存在多条记录,方便后续计算,这里需要进行去重处理...第四步,计算差值 这一步是辅助操作,使用第三步中辅助与用户登录日期做差值得到一个日期,若某用户某几列该相同,则代表这几天属于连续登录 因为辅助是float型,我们在做时间差时候需要用到to_timedelta...且unit='d'用来表示减去天数,这样获得差值就会是一个日期 df['date_sub'] = df['@timestamp'] - pd.to_timedelta(df['辅助'],unit...第六步,计算每个用户连续登录最大天数 这里用到是sort_values和first方法,对每个用户连续登录天数做组内排序(降序),再取第一个即为该用户连续登录最大天数 data = data.sort_values

3.3K30

开工大吉:几个让你月薪3万+excel神技能

- 动图教程 - ▲举例:求华东区A产品销售额 - 03 - VLOOKUP函数 用途:最常用查找函数,用于在某区域内查找关键字返回后面指定对应。...函数公式: =VLOOKUP(查找,数据表,序数,[匹配条件]) 函数解释: 相当于=VLOOKUP(找什么,在哪找,第几列,精确找还是大概找一找) 最后一个参数[匹配条件]0时执行精确查找,1...(或缺省)时模糊查找,模糊查找时如果找不到则返回小于第1个参数“查找最大。...函数公式: =MID(字符串,开始位置,字符个数) 函数解释: 将参数1字符串,参数2表示位置开始,截取参数3表示长度,作为函数返回结果。...当数组逻辑数组{TRUE,……TRUE,……}可以用来当做判断条件或计数用,当数组数值数组{数值,……数值,……}该数组就可以实现求和。

2.7K60

懂Excel轻松入门Python数据分析包pandas(二十四):连续区域

Excel 中实现方式直观简单 如下一份简单记录表: - 需要根据这份数据,得到最长连续下雨天数是多少,是几号到几号 - 上图红框是一部分符合条件,其中最长红框是需要结果 按照惯例,先看看如果在...Excel 上是怎么得到结果: - D 到 G 是辅助 - D:是C 下位移(不理解看上期文章) - E:对比 C 与 D 是否不一样 - F:对 E 结果数值化,True...1,False 0 - G:累计求和,上图可直接看到 G2 单元格公式,不多说了 - 注意看 G 内容,相当于根据 C内容,相同连续被划分到一个独立编号 - 接下来只需要条件筛选+...: - 行4:筛选下雨条件 - 行6:先对 df 过滤下雨行,按 diff_nums 分组统计 - 结果是一下子统计出各个连续下雨天数与日期范围 结果是需要得到其中 count 最大行...: - 行8:使用 idxmax 得到最大行索引 总结

1.3K30

微信小程序自定义yPicker组件分析及省市区三级联动实现

这不,最近项目中有个需求是 省市区三级联动 ,我就顺便组件库中第一个 「扩展日期-时间(点此直接至GitHub)」picker组件开始说一下这两个功能实现。...change中很简单:只需要把选中数据暴露给页面中(或者通过 triggerEvent 返回给调用页面)即可; columnchange中要做就是当前选中每一填充到data中对应数组某一项...multiArray主要用来表示监听几列,其元素都是一个个数组,如:[years, months, days, hours, minutes]multiIndex是当前每一(点开时)初始!...= {value: value} value数组,表示 picker-view 内 picker-view-column 当前选择是第几项(下标 0 开始) 需要注意是:其中只可放置<picker-view-column...(出现在indicator-style视野中元素)暴露到页面上,并将下标定位到这里 —— 以便在页面无刷新下下一次点开时从这里开始找!

75820

懂Excel轻松入门Python数据分析包pandas(二十四):连续区域

Excel 中实现方式直观简单 如下一份简单记录表: - 需要根据这份数据,得到最长连续下雨天数是多少,是几号到几号 - 上图红框是一部分符合条件,其中最长红框是需要结果 按照惯例,先看看如果在...Excel 上是怎么得到结果: - D 到 G 是辅助 - D:是C 下位移(不理解看上期文章) - E:对比 C 与 D 是否不一样 - F:对 E 结果数值化,True...1,False 0 - G:累计求和,上图可直接看到 G2 单元格公式,不多说了 - 注意看 G 内容,相当于根据 C内容,相同连续被划分到一个独立编号 - 接下来只需要条件筛选+...: - 行4:筛选下雨条件 - 行6:先对 df 过滤下雨行,按 diff_nums 分组统计 - 结果是一下子统计出各个连续下雨天数与日期范围 结果是需要得到其中 count 最大行...: - 行8:使用 idxmax 得到最大行索引 总结

1.1K30

Python判断连续时间序列范围并分组应用

最近在处理数据时候遇到一个需求,核心就是求取最大连续行为天数。 这里数据库中导出监测设备数据离线预警日志,需求是找出各监测对象设备掉线最长持续多久并确定其离线时长。...图1:案例数据 以上某监测对象数据显示:最长离线天数5月7日-5月10日持续4天。...整体思路如下: 构造日期天数辅助(定义日期转天数函数) 然后用辅助生成列表作为输入,构造时间序列处理函数生成可分段时间范围和天数 如果掉线天数与最大掉线天数相同,则这几天是最长连续离线日期范围(当然还可以求最近多少天内掉线情况...(x)) data_list.append(df3) res = pd.concat(data_list, axis=0, ignore_index=True,sort=False) print...连续掉线天数] print(res1) 以上本次分享全部内容,类似场景可触类旁通如:计算用户连续打卡天数、计算用户连续登录天数等!

1.9K20

在 BizTalk Server 2004 SP2 中存档和清除 BizTalk 跟踪数据库

默认 0 小时。 • @nLiveDays tinyint — 存在时间大于(生存小时数)+(生存天数任何已完成实例及其所有相关数据都将被删除。...早于此间隔所有内容都应在下一次存档时进行存档,然后清除。默认 30 天。 • @nvcFolder nvarchar(1024) — 存放备份文件文件夹。...默认 0 小时。 • @nLiveDays tinyint — 存在时间大于(生存小时数)+(生存天数任何已完成实例及其所有相关数据都将被删除。...早于此间隔所有内容都应在下一次存档时进行存档,然后清除。默认 30 天。 • @nvcFolder nvarchar(1024) — 存放备份文件文件夹。...如果设置 NULL,则数据不会数据库中清除。 • @nHours tinyint — 存在时间大于(生存小时数)+(生存天数任何已完成实例及其所有相关数据都将被删除。

2K30

Linux系统用户与属组管理

第五 密码最长有效期:指定在最近一次更改口令后,经过多久需要再次更改时间 第六 密码到期前警告天数:当账号口令过期时,系统会发出『警告』给这个账号 第七 密码过期后宽限天数:口令有效日期...时,表示该群组不具有群组管理员,至于第四个字段也就是支持账号名称,这四个字段意义号码 本列作用 第一 用户组:就是组名,本配置文件必须与/etc/group文件相对应....代表多少天之后必须修改密码,默认是99999 PASS_MIN_DAYS 0 #这行指定是两次密码修改间隔时间,也就是/etc/shadow文件第四字段。...默认是0 PASS_MIN_LEN 5 #这行代表密码最小长度,默认不小于5位。...#注:假如有一个用户创建时通过 -u 指定了 UID 550,那么下一次不指定-u 时,则起始UID 变成551开始,500-549之间那些会跳过不使用。

3.8K10

介绍十个Python小案例,新手入门就在这里

规定: 销售额低于或等于10万时,提成10%; 销售额低于或等于20万时,超过10万部分提成7.5%,其他从上; 销售额低于或等于40万时,超过20万部分提成5%,其他从上; 销售额低于或等于60...再加168又是一个完全平方数,求出该整数。...代码: 案例四:判断天数 要求: 顺序输入年、月、日,判断输入日期是该年份第几天。 分析: 输入任意日期如5月3日,现将1-4月天数相加,再加当前日期5即可。注意闰年形式。...分析: 入门必做案例 代码: 案例九:输出棋盘 要求: 输出国际象棋棋盘(黑白格) 分析: 用i控制行,j来控制,根据i+j变化来控制输出黑方格,还是白方格。...分析: 用i控制行,j来控制,j根据i变化来控制输出黑方格个数。 代码: 十个案例虽然小但是其中每个都透着代码智慧,欢迎转发+评论哦!

64230

制作 m 束花所需最少天数(经典二分+验证答案)

需要制作 m 束花。制作花束时,需要使用花园中 相邻 k 朵花 。 花园中有 n 朵花,第 i 朵花会在 bloomDay[i] 时盛开,恰好 可以用于 一束 花中。...请你返回花园中摘 m 束花需要等待最少天数。如果不能摘到 m 束花则返回 -1 。...思路: 对于不能满足情况无非是 bloomDay.size() < m * k; 我们很容易得到天数无非是在 bloomDay 元素中最小与最大之间。...那么我们自然就想到了二分去做,我们二分天数。如果当前天数可以实现采取m束花,那么我们就减少天数继续去试是否可以满足。不可以实现的话,我们就需要增大天数去试试。 如此就可以找到最少满足天数

38220
领券