首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分析常用Excel函数合集(下)

计算统计类 利用excel表格统计数据时,常常需要使用各种excel自带公式,也是最常使用一类,重要性不言而喻,不过excel都自带快捷功能。...MIN函数:找到某区域中最小值 MAX函数:找到某区域中最大值 AVERAGE函数:计算某区域中平均值 COUNT函数: 计算某区域中包含数字单元格数目 COUNTIF函数:计算某个区域中满足给定条件单元格数目...COUNTIF 功能:计算某个区域中满足给定条件单元格数目 语法:=COUNTIF(单元格1: 单元格2 ,条件) ? 6....WEEKDAY函数:返回对应于某个日期一周中第几天。 Datedif函数:计算两个日期之间相隔天数、月数或年数。 1....WEEKDAY 功能:返回对应于某个日期一周中第几天。默认情况下, 1(星期日)到 7(星期六)范围内整数。 语法:=Weekday(指定时间,参数),参数设为2,则星期一为1,星期日为7 ?

2.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

代码面试

Grokking the Coding Interview 模式一:滑动窗口 滑动窗口用于对给定数组和链表特定窗口大小执行所需操作 问题输入是线性数据结构。...许多情况下,两个指针可以帮助您找到具有更好空间或运行时复杂性解决方案。 确定何时使用“两指针”方法方法: 处理排序数组(或链接列表)并且需要找到一组满足某些约束元素时,它将遇到一些问题。...某些情况下,您不应该使用“两指针”方法,例如在单链列表中,您不能向后移动。何时使用快速和慢速模式一个示例是当您试图确定链接列表是否为回文式时。...很多涉及间隔问题中,您需要找到重叠间隔,或者如果它们重叠,则需要合并间隔。...合并间隔问题模式: 区间相交(中) 最大CPU负载(硬) 模式五:循环排序 此模式描述了一种有趣方法来处理涉及包含给定范围内数字数组问题。

1.7K31

机器学习中分类与回归差异

教程概述 本教程共分为 5 个部分,分别是: 函数逼近 分类 回归 分类与回归之间比较 分类与回归之间转换 函数逼近 预测建模问题,是基于历史数据来开发一个模型问题,这个模型可以对新数据(我们没有相应答案...举个例子,我们可能会预测一套房子可能以某个特定美元价值进行出售,而这个值可能会在 $100,000 到 $200,000 范围内。 回归问题需要预测一个数量。...通过进行一些小修改,某些算法可以同时用于分类和回归(例如决策树算法和人工神经网络)。...分类和回归之间转换 某些情况下,我们可以将回归问题转换为分类问题。比如说,要预测数量可以转换成离散桶(Buckets)。...某些情况下,分类问题可以转化为回归问题。比如说,一个标签可以转换为一个连续范围。

1.8K90

Redis3个高级数据结构

bit操作被分为两组: 恒定时间单个bit操作,例如把某个bit设置为0或者1。或者获取某bit值。 对一组bit操作。例如给定范围内bit统计(例如人口统计)。...你开始计算从0开始天数,就是你网站公开那天,每次用户访问网站时通过SETBIT命令设置bit为1,可以简单用当前时间减去初始时间并除以3600*24(结果就是你网站公开第几天)当做这个bit...这种方法对于每个用户,都有存储每天访问信息一个很小string字符串。通过BITCOUN就能轻易统计某个用户连续访问网站天数。...这个算法神奇在于不再需要与需要统计项相对应内存,取而代之,使用内存一直恒定不变。最坏情况下只需要12k,就可以计算接近2^64个不同元素基数。...GEO RedisGEO特性 Redis3.2版本中推出,这个功能可以将用户给定地理位置(经度和纬度)信息储存起来,并对这些信息进行操作。

2K10

Python基础教程 读书笔记(2)第二章 列表和元组

2.1序列概览 列表和元组主要区别在于,列表可以修改,元组则不能。也就是说如果要根据要求来添加元素,那么列表可能会更好用;而出于某些原因,序列不能修改时候,使用元组则更为合适。...使用后者理由通常是技术性,它与Python内部运作方式有关。这也是内建函数可能返回元组原因。一般来说,几乎所有的情况下列表都可以替代元组。...编写一个列表: >>> edward=['Edward Gumby',42] 构建如下一个人员信息列表也是可以,这个列表就是你数据库: >>> john=['John Simith',50] >...除此之外,Python还有计算序列长度、找出最大元素和最小元素内建函数。 2.2.1索引 序列中所有元素都是有编号—从0开始递增。...13 May13th2015 2.2.2分片 与使用索引来访问单个元素类似,可以使用分片操作来访问一定范围内元素。

45620

Excel自动生成进度跟踪图

表格是图表数据库,先写好表格。...对这种图来说,重要就是四个数据:计划开始时间,实际开始时间,计划天数,实际使用天数 注意: 黄色部分是手工填写 工作日使用函数=NETWORKDAYS(E7,D7)来计算 日历时间直接日期-日期即可...真的天数请看 日历计划天数和工作日天数 ? 2.插入累积条形图 ? 由于此时图表中有四项内容,需将实际开始日和实际工时置于次坐标轴上。图表中点击右键,选择“更改系列图表类型”。 ? ?...注意,如果还是乱,那就是主和次时间轴没有一致! 修改 横坐标轴最大值与最小值,使最大值和最小值位于数据区域给定日期范围附近。...选中图表中计划用时或者实际用时对应条形图,点击鼠标右键选择“设置数据系列格式”,调整系列重叠设置,此处设置为“-20%”,主次有别。当然也可以设置为0%, 主次完全重叠! ?

2K20

Redis 3 个高级数据结构

bit操作被分为两组: 恒定时间单个bit操作,例如把某个bit设置为0或者1。或者获取某bit值。 对一组bit操作。例如给定范围内bit统计(例如人口统计)。...你开始计算从0开始天数,就是你网站公开那天,每次用户访问网站时通过SETBIT命令设置bit为1,可以简单用当前时间减去初始时间并除以3600*24(结果就是你网站公开第几天)当做这个bit...这种方法对于每个用户,都有存储每天访问信息一个很小string字符串。通过BITCOUN就能轻易统计某个用户历史访问网站天数。...这个算法神奇在于不再需要与需要统计项相对应内存,取而代之,使用内存一直恒定不变。最坏情况下只需要12k,就可以计算接近2^64个不同元素基数。...GEO RedisGEO特性 Redis3.2版本中推出,这个功能可以将用户给定地理位置(经度和纬度)信息储存起来,并对这些信息进行操作。

47820

学会这14种模式,你可以轻松回答任何编码面试问题

某些情况下,窗口大小保持不变,而在其他情况下,窗口大小会增大或缩小。...许多情况下,两个指针可以帮助你找到具有更好空间或运行时复杂性解决方案。 确定何时使用"两指针"方法方法: 处理排序数组(或链接列表)并且需要找到一组满足某些约束元素时,它将遇到一些问题。...某些情况下,你不应该使用"两指针"方法,例如在单链列表中,你不能向后移动。何时使用快速和慢速模式一个例子是,当你尝试确定链接列表是否是回文。...它们将是涉及编号在给定范围内排序数组问题 如果问题要求你排序/旋转数组中查找缺失/重复/最小数字 具有循环排序模式问题: 查找丢失号码(简单) 查找最小遗漏正数(中) 6、就地反转链表 很多问题中...在任何时候,都可以从两个堆顶部元素计算当前数字列表中位数。

2.8K41

最大休假天数(DP)

题目 力扣想让一个最优秀员工 N 个城市间旅行来收集算法问题。 但只工作不玩耍,聪明孩子也会变傻,所以您可以某些特定城市和星期休假。...对于每个城市,不同星期您休假天数是不同给定一个 N*K 矩阵 days 代表这种限制,days[i][j] 代表您在第j个星期城市i能休假最长天数。...给定 flights 矩阵和 days 矩阵,您需要输出 K 周内可以休假最长天数。...注意: N 和 K 都是正整数, [1, 100] 范围内。 矩阵 flights 所有值都是 [0, 1] 范围内整数。 矩阵 days 所有值都是 [0, 7] 范围内整数。...超过休假天数您仍可以呆在那个城市,但是额外日子您需要 工作 , 这些日子不会算做休假日。 如果您从城市A飞往城市B并在当天休假日, 这个休假会被算作是城市B休假日。

90730

如何优雅地使用Redis之位图操作

前言 进入今天主题前,先简单地解释下Redis中位图到底是什么。Redis官方文档对于位图介绍如下: 位图不是一个真实数据类型,而是定义字符串类型上面向位操作集合。...使用位图统计登录天数 接下来我们有一个新需求,就是统计某个用户注册后前10天登录天数,Redis中有个bitcount命令,可以统计某个字符串中比特位为1数量,其还有2个参数start和end,表示要统计范围...,咋一看好像可以用来实现我们这个需求,但是这里有一个坑需要注意下,bitcount命令start和end参数指的是字节索引,而不是比特位索引,而我们如果要使用位图来统计某个用户注册后前10天登录天数的话...只要能够统计出截取出来字节数组中比特位值为1数量,接下来再减去不包含在对应比特索引中比特值为1数量,即可统计出给定比特索引范围内比特值为1数量。...我们要统计出用户注册后前10天登录天数,如果用位图存储用户登录状态,位图中索引为注册天数的话,那么我们需要统计比特索引从0到9比特值为1数量,才能计算出该用户注册后前10天登录天数

66930

机器学习入门科普:监督学习和无监督学习都是什么?都能干什么?

此外,可以引入一个基本声明:一个算法只有影响实际数据时,才能推断出一般规律,并以相对较高精度来学习算法结构。虽然术语预测可以自由使用,但其具有与物理学或系统理论相同含义。...Stock price: 股票价格 Days: 天数 Final price: 最终价格 使用相同数据集训练两个不同模型,分别对应于红线和绿线。...图中所有边界上三角形彼此接近,因此最近点是另一个三角形,其属于同一类。然而,现实生活中分类问题往往存在着部分重叠边界,这意味着根据特征考虑某些点时具有不确定性。...一旦所有高斯分布方差和平均值(即形状)变得稳定,则边界点在特定高斯分布范围内(除了相等概率情况下)。 从技术上讲,可以说这种方法最大限度地提高了给定某个数据高斯混合分布可能性。...强化学习中,这种反馈通常被称为奖励(reward)(有时候,负面的反馈被定义为惩罚),而了解一个状态下执行某个行为是否是正面的是非常有用

47320

数据学习之数据仓库代码题总结上

可以用来计算超过了百分之多少的人;排名计算公式为:(当前行rank值-1)/(分组内总行数-1) CUME_DIST() 计算某个窗口或分区中某个累积分布。...新增用户数:某个时间段(一般为第一整天)新登录应用用户数。 登录用户数:登录应用后至当前时间,至少登录过一次用户数。...以下是相关两个表格: 请编写 SQL 查询,计算从注册当天开始每个用户注册后第1天、第3天、第7天学习留存率。留存率计算方式是注册后特定天数内继续学习用户数除以当天注册用户总数。...现在任务是计算每个品牌打折销售天数。然而,由于数据中存在时间交叠情况,我们需要合理处理这种情况,避免重复计算销售天数。因此,你需要设计一条 SQL 查询来解决这个问题。...现在任务是编写一条 SQL 查询,计算员工薪水中位数。由于计算中位数需要对数据进行排序和分析,这个问题在 SQL 中相对复杂。你可以使用窗口函数和子查询等技术来解决。

14710

【编程心里】编程大牛教你正确学习心态

给定以八个数值代表两个矩形区域,请写出判断两个区域是否有重叠 C 语言程序。...其中不少题目电脑都已经知道怎么解——是别的程序员事先告诉它——比如「求一堆散落在三维直角座标系之中多面体 8(x−3)−10(y+1)−11(z−1)=0 这个平面上一个给定范围内投影」或者「给定一些彼此相连顶点...别说 C 语言,一切编程语言最终都只能做数学题,根据给定数据,算出另一些数据,算出更多数据,然后存贮、发送或者呈现算出数据。 ? 不过我能理解你困惑。...这些你无法直接观测到 Python 程序运行在世界某个角落某些计算机上,隔着光缆、双绞线和无线基站,为你面前或掌上用户界面注入生命。 ?...所以,回到你问题上来,是的,学会 C 计算机语言真的可以开发出很多东西,但除非内力深厚,场合适当,并且闲得蛋疼,大多数人不会拿 C 或者只拿 C 来开发太大东西。

1.1K50

「分布式架构」“一切都是分布式”说最终一致性

partition-only两个可以实现在任何给定时间。...开始之前,让我们先建立一些定义: N =存储数据副本节点数 W =更新完成之前需要确认已收到更新副本数量 R =通过读操作访问数据对象时所接触副本数 如果W+R > N,那么写集和读集总是重叠...当然,在后一种情况下存在故障情况下,持久性不能得到保证,如果W < (N+1)/2,那么当写集不重叠时,就有可能出现写冲突。 当W+R <= N时出现弱/最终一致性,这意味着读写集有可能不重叠。...如果您使用传统多数仲裁方法,那么具有W个副本集节点分区可以继续进行更新,而另一个分区变得不可用。对于读集也是如此。给定这两个集重叠,根据定义,少数集变得不可用。...分区并不经常发生,但确实会发生在数据中心之间以及数据中心内部。 某些应用程序中,任何分区不可用性都是不可接受,重要是能够到达该分区客户机能够取得进展。

53420

盘点66个Pandas函数,轻松搞定“数据清洗”!

它既支持替换全部或者某一行,也支持替换指定某个或指定多个数值(用字典形式),还可以使用正则表达式替换。...clip()方法,用于对超过或者低于某些数值进行截断[1],来保证数值一定范围。比如每月迟到天数一定是0-31天之间。...函数方法 用法释义 cat 字符串拼接 contains 判断某个字符串是否包含给定字符 startswith/endswith 判断某个字符串是否以...开头/结尾 get 获取指定位置字符串 len...计算字符串长度 upper、lower 英文大小写转换 pad/center 字符串左边、右边或左右两边添加给定字符 repeat 重复字符串几次 slice_replace 使用给定字符串,替换指定位置字符...如果大家有工作生活中进行“数据清洗”非常有用Pandas函数,也可以评论区交流。

3.7K11

Java 某个起始时间,固定累加天数计算周期

Java应用程序开发中,常常需要对日期和时间进行操作。例如,我们需要计算某个日期之后若干天是哪一天,或者计算两个日期之间相差多少天。...本文将介绍一种常见需求:给定某个起始时间和固定累加天数计算出一组时间周期。需求分析假设我们有如下需求:要求根据某个起始时间和固定累加天数计算出从起始时间开始若干个时间周期。...例如,假设起始时间为2023年6月1日,累加天数为30天,则我们需要计算出以下30个时间周期:2023-06-012023-06-022023-06-03...2023-06-30这个需求非常常见,例如在按天统计数据...解决方案Java中,针对时间和日期处理,我们通常使用java.time包中类来进行操作。...:给定某个起始时间和固定累加天数计算出一组时间周期。

76420

提升编程效率利器: 解析Google Guava库之集合篇RangeSet范围集合(五)

例如,可以使用contains©方法查询给定元素是否RangeSet里,rangeContaining©方法返回包含给定元素Range(如果不存在则返回null),以及encloses(Range...高效查询操作: RangeSet提供了丰富查询操作,可以快速地判断一个元素是否某个范围内、获取包含某个元素范围等。这些查询操作都是基于对范围树高效遍历实现,能够在对数时间内给出结果。...请注意,实际应用中,处理无限范围时应该特别小心,因为整数是有界,而TreeRangeSet某些操作可能会受到这个限制影响。...它基于范围树数据结构,实现了范围自动合并和高效查询操作。通过RangeSet,我们可以方便地管理和操作各种范围集合,满足各种复杂需求。...实际应用中,我们可以利用RangeSet来解决时间范围管理、数字范围限制等问题,提高代码可读性和维护性。 术因分享而日新,每获新知,喜溢心扉。

8810

混合密度网络(MDN)进行多元回归详解和代码示例

这是结果: 这是披萨交付时间数据分布“密度”。平均而言,每次交付需要 30 分钟(图中峰值)。它还表示, 95% 情况下(2 个标准差2sd ),交付需要 20 到 40 分钟才能完成。...这也意味着数据集中可能缺少一个可以帮助避免集群更高维度上重叠重要特征。...在这个非常特殊情况下,我最喜欢选择是假设在数据某些区域,X 有多个 Y,而在其他区域;仅使用其中一种混合。: 例如,当 X = 0 时,每种混合可能有两种不同 Y 解。...因此,混合密度网络可用于表示它学习每个混合中“行为”,其中行为由概率和轨迹组成((x,y)坐标未来某个时间范围内)。...总结 · 与线性或非线性经典 ML 模型相比,MDN 单变量回归数据集中表现出色,其中两个簇相互重叠,并且 X 可能有多个 Y 输出。

81920

可视化数据科学中概率分布以帮你更好地理解各种分布

某些分布假设下,某些机器学习模型被设计为最佳工作。因此,了解我们正在使用哪个发行版可以帮助我们确定最适合使用哪些模型。 ? 介绍 拥有良好统计背景可能对数据科学家日常生活大有裨益。...离散数据只能采用某些值(例如学校中学生人数),而连续数据可以采用任何实数或分数值(例如身高和体重概念)。 从离散随机变量中,可以计算出 概率质量函数,而从连续随机变量中,可以得出 概率密度函数。...概率质量函数给出了一个变量可以等于某个概率,相反,概率密度函数值本身并不是概率,因为它们首先需要在给定范围内进行积分。...“概率论中, 中心极限定理 (CLT)确定,某些情况下,当添加独立随机变量时,即使原始变量本身未呈正态分布,其适当归一化和也趋于正态分布。” —维基百科 ? ?...一些例子是: 高斯朴素贝叶斯分类器 线性判别分析 二次判别分析 基于最小二乘回归模型 此外,某些情况下,还可以通过应用对数和平方根之类转换将非正常数据转换为正常形式。

92620
领券