使用lag和ignore first row计算SQL中行之间的平均值 - 腾讯云开发者社区

apache-spark、pyspark

我想知道使用x次的窗口是否会执行x次数据洗牌。例子： from pyspark.sql import functions as F from pyspark.sql.window import Window w = Window.partitionBy('col_a').orderBy('date') df = df.withColumn('new_col_1', F.lag('col_b').over(w)) df = df.withColumn('new_col_2', F.row_number().ov

浏览 0提问于2021-12-08得票数 1

回答已采纳

2回答

用于在值之间进行插值的SQL查询

sql、oracle

我打算在列中的值之间进行插值(SQL线性插值)，并使用查询将其插入到新列中。根据我在网上的搜索，我怀疑LEAD分析函数可能有用。我是编写SQL查询的新手。因此，任何关于如何实现这一目标的见解都将非常有帮助。示例数据集如下所述： Emp Test_date Value --- --------- ----- A 1/1/2001 null A 1/2/2001 100 A 1/3/2001 null A 1/4/2001 80 A 1/5/2001 null A 1/6/2001 null A 1/7/2001 75

浏览 128提问于2019-05-09得票数 2

回答已采纳

2回答

如何在sql where中获取条件是特定日期差异的row_numbers？

sql、postgresql、date、window-functions

我不得不使用查询的一部分来提取日期相差至少三个月的row_numbers。所以在下面的例子中，我想提取row_number 1(总是第一个)，5和6。所以在row_number 1之后，row_numbers的date_diff >3个月(在第二个提取row_number之后，再次应用这个条件，直到没有)。SQL中有没有什么函数或方式可以实现这样的条件？ table_name: users id row_number User date ---|----------|-------|---------------------| 1 |1

浏览 0提问于2018-04-18得票数 0

1回答

SQL:理解N行和当前行之间的行中的"n“

sql、join、average、cumulative-sum

我在SQL中有一个表("my_data")： id var_1 var_2 1 1 1 1 2 1 1 1 3 1 0 0 4 1 0 1 5 1 0 1 6 1 1 1 7 2 1 0 8 2 0 0 9 2 0 1 10 2 1 0 11 2 0 1 12 3 0 1 13 4 0 0 14 4 1

浏览 1提问于2022-06-23得票数 0

回答已采纳

2回答

Oracle SQL -按主题分列的日期之间的平均时间

sql、oracle

我在Oracle SQL工作。我有一个有I和日期的表，我试图按主题找到日期之间的平均时间。看起来会是这样的。表格 SubjectID Date 1 8/01/2013 12:00:00 AM 1 8/31/2013 12:00:00 AM 1 9/10/2013 12:00:00 AM 2 1/01/2010 12:00:00 AM 2 1/21/2010 12:00:00 AM 可以说，我需要编写一个由SubjectID遍历该表的查询，记录日期之间的时间，并输

浏览 1提问于2013-08-23得票数 0

回答已采纳

1回答

SQL Select可根据多个状态字段值确定设备状态

sql、amazon-redshift、aggregate-functions、coalesce

浏览 4提问于2018-12-03得票数 0

1回答

SQL Server -连接前5行

sql、sql-server、concat、coalesce

我已经得到了sql代码，它在分区和排序后在column1中创建了前5行的平均值： CAST (AVG(col1) OVER (Partition by col2 ORDER BY col3 ASC ROWS BETWEEN 5 PRECEDING AND 1 PRECEDING) AS DECIMAL(3,2)) AS col1avg 我想做一个类似的事情，但不是取5个值的平均值，而是创建一个用逗号分隔5个值的字符串。我尝试了多种想法，但都没有成功。任何帮助都将不胜感激。

浏览 9提问于2019-09-14得票数 0

回答已采纳

2回答

滞后函数与零点

sql、null、google-bigquery、lag

因此，我尝试使用一个滞后函数(Google BigQuery)，我的第一个值是NULL。我用一个滞后函数来得到lag_Value_1，lag_Value_2.在这里： SELECT ITEM,row_A,row_B,date,Value_1,Value_2,Value_3,Value_4,Value_5, LAG(Value_1,0) OVER (PARTITION BY ITEM ORDER BY row_A asc) as lag_Value_1, LAG(Value_2,0) OVER (PARTITION BY ITEM ORDER BY

浏览 0提问于2020-05-27得票数 0

回答已采纳

2回答

计算R中两个时间戳之间的差异；NA与时间差输出一起出现

r、dplyr、lag、lead、difftime

我正在计算数据帧中两个时间戳之间的小时差。一个时间戳在前一行，即lasttime，另一个在前导行，即origtime。下面是一个小例子： library(dplyr) df<-structure(list(DateTime_Start = structure(c(1612284131.736, 1612296614.851 ), tzone = "UTC", class = c("POSIXct", "POSIXt")), DateTime_End = structure(c(1612284195.736,

浏览 35提问于2021-08-30得票数 0

回答已采纳

4回答

R:行标签和列标签数据子集的平均值

r、subset、mean

假设我有： set.seed(42) d = data.frame(replicate(6,rnorm(10))) col_labels = c("a", "a", "b", "b", "c", "c") row_labels = c(1,1,1,2,2,3,3,4,4,4) 现在我要计算d的一个子集的平均值，该子集对应于col_labels和row_labels的每个组合，即： s = subset(d, row_labels==1, select=col_labels=="a"

浏览 0提问于2014-09-24得票数 2

回答已采纳

1回答

Elasticsearch获取平均值

elasticsearch、elasticsearch-aggregation、elasticsearch-java-api

我正在尝试平均elasticsearch上的聚合数据。这是我的数据结构：文档1 { "groupId":"TEST_01", "lag":10, "detectionDate":"2021-02-26T21:42:30.010Z", "tipo":"uno", "topics":[ { "name":"topic_01", "valore"

浏览 55提问于2021-03-01得票数 0

回答已采纳

2回答

如何获得SQL中列的平均日期间隔？

sql、postgresql、date、group-by、average

我有一个网站上的用户交互表，我需要计算每个用户之间的平均交互时间。为了更简单地理解，下面是表的一些记录：其中第一列是用户id，第二列是交互时间。我需要的结果是每个用户交互之间的平均时间。示例：用户12345平均交互间隔为1天。我已经尝试过使用窗口函数，但是我无法得到平均值，因为PostgreSQL不允许我在窗口函数上使用GROUP或AVG，我可以使用以下命令获得间隔，但不能根据用户id对其进行分组。 SELECT INTERACTION_DATE - LAG(INTERACTION_DATE ) OVER (ORDER BY INTERACTION_DATE ) 因此

浏览 0提问于2018-05-18得票数 1

回答已采纳

4回答

使用带有前导null的SQL窗口函数计算移动平均值，其中没有足够的数据是可维护的

sql、postgresql、window-functions

我想使用SQL窗口函数计算移动平均值。下面的2“天”移动平均线的例子基本上可以正常工作，但如果只有一个数据点可用，它也可以计算平均值。只要没有足够的数据，我更希望平均值为null。 create table average( nr int, value float ); insert into average values (1, 2), (2, 4), (3, 6), (3, 8), (4, 10); SELECT nr, value, AVG(value) OVER (ORDER BY nr ROWS BETWEEN 1 PRECEDING

浏览 1提问于2019-04-08得票数 6

回答已采纳

2回答

如何根据条件生成列的范围

sql、sql-server、powerbi、window-functions、gaps-and-islands

有一个带有数字的列-我想开发一个报告，将此列的值分类为范围(下限和上限)。如果值的差异大于10，则必须进行这种拆分。这是否可以通过Power BI或SQL Server中的查询来实现？ ? ?

浏览 17提问于2020-01-23得票数 4

回答已采纳

1回答

SQL中从一行到另一行的分配值

mysql、sql、snowflake-cloud-data-platform

我有下表： CREATE TABLE table_one( person varchar(55), date_value date, proj varchar(2), value int, time varchar(2 ); INSERT INTO table_one VALUES ('A1',2020-10-01'W',10,'T1') ('A1',2020-10-01'A',5,'T2') ('A1',2020-10-01'P',6,'T3'

浏览 3提问于2022-10-28得票数 0

回答已采纳

2回答

如何在SQL表中返回带有列条件的前行值？

sql、case、impala

我有下面的SQL表，其中仅当条件类型为00时才需要最新的价格： ProductID ConditionType Date Price 00001 01 2018-01-01 4.00 00001 01 2018-01-08 5.00 00001 00 2018-01-09 4.50 00001 01 2018-01-22 6.00 00001 00 2018-01-29 3.00 我尝试过使

浏览 14提问于2019-04-17得票数 1

回答已采纳

2回答

如何集成来自不同日期的两个数据集的数据？

r、dataframe、dplyr

假设有两个数据集。Dataset df1是特定事件发生的一年中的某一天。Df1还有多个其他专栏，但对于本问题而言，只有日期很重要。Df2包含两列:进行度量的年份日期和该度量的值。实际上，我想在df1中创建一个新列("AVG")，它是当天df2的平均值加上前一天的值。例如，df1中第2天的平均值为12.5 ((10+15)/2)。下面是一些示例数据。 df1 <- structure(list(day = c(2, 5, 7)), class = "data.frame", row.names = c(NA, -3L)) df2 <- stru

浏览 20提问于2020-09-09得票数 2

回答已采纳

1回答

如何用一些额外的公式编写SQL来计算运行中的平均值？

sql、sql-server、ssms、ssas

以下是我计算出的运行平均值的图像。但是，在运行平均水平之上，这一要求是额外的。下面是Microsoft表中需求所在的图像。因此，为了用收集在excel表中的公式(如=(3*C4+2*C5+1*C6)/6 )计算运行平均值，可以编写什么SQL查询？另外，如果通过SQL是不可行的，那么我如何在SSAS中使用第二张图像中的D列作为我的度量？

浏览 1提问于2020-04-30得票数 3

回答已采纳

1回答

SQL自动生成缺少日期和表中缺失日期的前一个日期的价格。

sql、oracle

我有一个表MKT，其中包括以下字段，value_date,stk_exch,security,mkt_price,source,currency,name，例如，每天500种证券(不包括星期六和星期日及其他市场假日)。我需要一个sql自动生成失踪日期和价格从前一个日期失踪日期。因此，如果周五是26.07.2013，周六和周日是27和28，那么27和28的日期和价格将从这张表中消失。因此，在计算整个月的价格时，我应该得到所有的日期和遗漏的日期，例如: 27和28，sql的价格为26。我在用甲骨文 value_date stk_exch security mkt_pric

浏览 3提问于2013-07-30得票数 4

1回答

(红移)垂直聚结/ FIRST_VALUE()集合

sql、amazon-redshift、aggregation

(这是特定于Redshift的，应该说明它的柱状性质、排序顺序等等) 当按时间戳排序时，我需要从每一列中获得第一个非空值。本质上，它与FIRST_VALUE()一样，但作为一个聚合。或者，合并()作为聚合。然而，Redshift没有PostgreSQL或甲骨文后期版本的细节。因此，我正在寻找选项来测试我的1亿行导入:) (我不喜欢我的任何一种选择，但我很难找到更好的选择。) 样本输入 category | row_timestamp | value_a | value_b | value_c ----------+---------------+---------+--------

浏览 0提问于2019-02-14得票数 2

回答已采纳

2回答

用雪花SQL填充最近的非空值

sql、snowflake-cloud-data-platform

这是我的表 id category A Apple A NULL A Apple B NULL B Pear B Pear B Peach B NULL B NULL C NULL C NULL C Apple 这就是我想要的桌子 id category A Apple A Apple A Apple B NULL B Pear B Pear B Peach B P

浏览 2提问于2021-01-18得票数 4

回答已采纳

2回答

数据帧中的间接引用

我想引用数据帧列中的值，其中行索引依赖于另一列的值。示例： value lag laggedValue 1 1 2 2 2 4 3 3 6 4 2 6 5 1 6 6 3 9 7 3 10 8 1 9 9 1 10 10 2 在Excel中，我在列“laggedValue”中使用了这个公式： =INDIRECT("B"&(ROW(B2)

浏览 7提问于2014-03-25得票数 0

回答已采纳

4回答

计算每个客户的平均订单间隔时间

sql、oracle

我已经找遍了所有地方，但似乎找不到如何计算每个客户的平均订单间隔时间。我使用的是Oracle SQL Developer。我试过在没有使用joy的情况下使用lag()函数。下面的示例数据显示了一个客户在3个不同的场合购买的数据。所有购买之间的平均时间为7.5d ((6+9)/2)。 CustID OrderDate ------- --------- 1000000 14-AUG-12 1000000 23-AUG-12 1000000 29-AUG-12 那么如何计算每个客户平均值呢？任何帮助都将不胜感激。

浏览 5提问于2013-04-30得票数 4

回答已采纳

2回答

针对列值在sql中重复记录

sql、oracle11g、oracle10g

我正在寻找任何逻辑来将这些数据输出到下面的格式中。但是在sql中找不到任何逻辑来实现这一点。给定表 ID Country AreaDiscount Email AB0215000001 Belgium 120 cm + 10% Abc@gmail.com 130 cm + 20% Abc@gmail.com 140

浏览 6提问于2016-03-07得票数 0

回答已采纳

2回答

Apache Spark:指数移动平均

scala、apache-spark、hive、apache-spark-sql、spark-dataframe

我正在用Spark/Scala编写一个应用程序，其中我需要计算列的指数移动平均值。 EMA_t = (price_t * 0.4) + (EMA_t-1 * 0.6) 我面临的问题是，我需要之前计算的同一列的值(EMA_t-1)。通过mySQL，这是可能的，通过使用模型或通过创建一个EMA列，然后您可以逐行更新，但我已经尝试过这种方法，并且既不使用Spark SQL也不使用Hive上下文...有什么方法可以访问这个EMA_t-1吗？我的数据如下所示： timestamp price 15:31 132.3 15:32 132.48 15:33 132.76 15:34 132.

浏览 1提问于2015-11-27得票数 1

2回答

嵌套向量算术均值

clojure

我的计划是计算矩阵(矩阵/嵌套向量)的行或列的算术平均值。到目前为止，我已经能够计算矩阵中行的算术平均值，即 (defn arithmean [x] (let [data x num (count data)] (vec (apply map (fn [& items] (/ (apply + items) num)) data)))) 我更关心的是能够输入多个嵌套向量，类似于x& args的方式输入到前面的函数中。但也会对能够计算矩阵中单个列的平均值感兴趣。

浏览 4提问于2014-01-24得票数 0

回答已采纳

1回答

如何在sql中使用case语句对满足条件的记录中的连续值进行平均

sql-server、sql-server-2012、average、case-statement

因此，我有一个包含字段的表：因此，这个值- 1023和QualityCode - 53可以随机出现，对于每个MeterNum，大约有24个值，ROW_ID递增到24，然后从1开始对于新的MeterNum，我需要用平均值46和21 (row_num 19和21)替换1023，如果不能至少在select语句中添加另一个别名列。我试着想出案例陈述，但我不能平均这些值，有人能帮我吗？

浏览 0提问于2017-09-02得票数 0

2回答

MySQL计算N行移动平均

mysql

我试图在一个查询中计算N行的移动平均值N行，的所有行的。在这个例子中，我试图计算50行的移动平均值。 SELECT h1.date, h1.security_id, ( SELECT AVG(last50.close) FROM ( SELECT h.close FROM history as h WHERE h.date <= h1.date AND h.security_id = h1.security_id OR

浏览 5提问于2016-01-16得票数 2

回答已采纳

4回答

加入下一层序排

sql、sql-server、join、union

我现在正在计划一条SQL语句，需要有人检查一下我的想法。这是我的桌子： id stat period --- ------- -------- 1 10 1/1/2008 2 25 2/1/2008 3 5 3/1/2008 4 15 4/1/2008 5 30 5/1/2008 6 9 6/1/2008 7 22 7/1/2008 8 29 8/1/2008 创建表 CREATE TABLE tbstats ( id INT IDENTITY(1

浏览 13提问于2014-10-15得票数 1

回答已采纳

1回答

是否有一种方法可以使用滞后函数并从已分配组中的第一行中减去，直到在重复该过程之前达到某个值？

r、dplyr、lag

例如，如果我有一个如下所示的数据集 structure(list(ID = c(123, 123, 123, 123, 123, 145, 145, 145, 145, 145, 145), `Date Time` = structure(c(1663037145, 1663037160, 1663040745, 1663042520, 1663043060, 1663372800, 1663373100, 166337

浏览 5提问于2022-08-30得票数 0

1回答

具有列更改的SQL Server中的排名

sql、sql-server

下面是原始表，我想根据每种产品的Install_Status和日期列的变化进行排名。 ? 查询： ;WITH CTE AS ( SELECT Product, Install_Status, Date_Inserted, DENSE_RANK() OVER (PARTITION BY Product ORDER BY rank) rank FROM (SELECT Product, Install_Status, Date_Inserted, ROW_NUMBER() OVE

浏览 12提问于2020-12-16得票数 0

回答已采纳

4回答

找出四个最后元素的平均值

r、dplyr

我的数据集有以下形式： df<- data.frame(c("a", "a", "a", "a", "a", "a", "a", "a", "b", "b", "b", "b", "b", "b", "b", "b"), c(1, 1, 1, 1, 2, 2, 2, 2,

浏览 5提问于2017-04-05得票数 1

回答已采纳

3回答

R中聚合结果的滚动平均

r、data.table、rolling-computation、rolling-average

我有一个数据库，为属于不同行业的个别公司提供销售价值。在下面的示例数据集中： set.seed(123) df <- data.table(year=rep(1980:1984,each=4),sale=sample(100:150,20),ind=sample(LETTERS[1:2],20,replace = TRUE)) df[order(year,ind)] year sale ind 1: 1980 114 A 2: 1980 102 A 3: 1980 130 B 4: 1980 113 B 5: 1981 136 A 6:

浏览 4提问于2020-12-26得票数 0

回答已采纳

1回答

使用LAG的SQL update

sql、sql-update

我正在尝试更新一个如下所示的表格。我希望colB更新为1，直到我们得到3(12-10-2020)..then更新colB为3，直到12-15-2020。我正在尝试使用Lag和merge，但是不能一次更新所有的内容。必须多次运行查询。有什么线索吗？请帮帮忙。非常感谢! ColA ColB ColC 12-1-2020 1 X 12-2-2020 0 12-3-2020 0 12-4-2020 0 . . .12-10-2020 3 Y . . 12-15-2020 0

浏览 19提问于2020-12-07得票数 0

1回答

如何获取前面的行值Teradata

row、teradata、lag

我有以下格式的数据 Id Code Date Amount Type 101 B25 5/4/2020 $500 C 101 A15 5/5/2020 $100 D 101 D15 5/5/2020 $200 D 102 B35 6/2/2020 $400 C 102 A15 6/2/2020 $50 D 我需要以下几点 Id Code D

浏览 5提问于2021-07-08得票数 0

回答已采纳

1回答

字段中的平均整数；不是行项

sql、sql-server

我希望SQL从两列中添加数字，并将这两个数字的平均值放在一个单独的列中。我目前正在以这种方式使用AVG： AVG(InpCount + OutCount) OVER (PARTITION BY ProcedureID) as AverageCount, AVG(InpAmount + OutAmount) OVER (PARTITION BY ProcedureID) as AverageAmount, 我希望SQL给出一个InpCount + OutCount的平均值，并将这个平均值放在上面的AverageCount列中。如果我也能对InpAmount + InpCount字段这样做，那么

浏览 2提问于2014-01-24得票数 0

回答已采纳

1回答

使用SQL Hana对数据进行分组

sql、group-by、hana、gaps-and-islands

我有以下数据集结构。其中，列状态表示1-退出，0-受雇。我想知道如何编写一个SQL查询来按员工ID分组，以便显示从他们加入(或重新加入)公司到他们退出/结束这段时间的周期。其中，如果一名员工辞职后又重新加入，他们将在不同的唯一字段中表示。因此，生成的数据帧应该如下所示：我正在努力学习HANA的SQL方言。在处理这些重新加入的情况时，我不太确定如何根据ID和状态进行分组。谢谢!

浏览 2提问于2021-04-02得票数 0

1回答

使用PostgreSql在5分钟间隔内插入最后已知的价格

postgresql、finance

我有一张表，用来按蜱阿根廷债券数据来存储滴答： bonos=# \d preciosrt Table "public.preciosrt" Column | Type | Collation | Nullable | Default ------------+------------------------+-----------+----------+----------

浏览 0提问于2020-11-14得票数 0

回答已采纳

1回答

SQL sum每行超过限制范围的值的行间持续时间

sql、sql-server、tsql、datediff

有点SQL业余爱好者，所以坚持使用VantagePoint的SQL后处理插件将简单的C++/Python/Excel函数转换为SQL查询。希望做一些像这样的excel功能，所以我只有时间戳和值。如果读数的值小于下限，则计算两次读数之间的总耗时，然后添加到该运行和，对于高于下限的读数的运行总和也是如此。这将是正常的伪代码，但不确定如何使用CLR将其转换为SQL foreach(row) if(value < lowLimit) lowSum += (time[row] - time[row - 1]) if(value > highLimit)

浏览 0提问于2017-12-22得票数 0

1回答

用以前的行值填充表中的行oracle sql

sql、oracle、plsql、oracle11g、oracle-apex

+----+---------+-------+--------+---------+--------+ | id | counter | name | duties | remarks | monies | +----+---------+-------+--------+---------+--------+ | 1 | 1 | jake | | | | | 2 | 0 | | clean | misc | 12k | | 3 | 1 | james | |

浏览 8提问于2021-02-13得票数 0

回答已采纳

3回答

dbplyr的滚动均值、标准差

r、mean、rolling-computation、dbplyr

我想用滚动函数设置一个新变量(滚动平均值，stdev...etc)。在dbplyr 这是一个数据库 library(odbc) library(DBI) library(tidyverse) library(zoo) con <- DBI::dbConnect(odbc::odbc(), Driver = "SQL Server", Server = "xx.xxx.xxx.xxx", Database =

浏览 4提问于2021-02-19得票数 0

回答已采纳

2回答

按datediff分组行，然后使用diff函数

sql、postgresql

我在PostgreSQL中有一个带有时间戳列created_at和整数列user_id的表。 id | created_at | user_id 1 | 2019-10-14 09:26:53.813 | 1 2 | 2019-10-14 09:26:54.813 | 1 3 | 2019-10-14 09:46:53.813 | 1 4 | 2019-10-14 09:46:54.813 | 2 5 | 2019-10-14 09:46:55.813 | 1 6 | 2019-10-14 09:46:56.813 | 1 7 | 2019-10-14 09:46:57.813 | 2 每一行

浏览 3提问于2019-10-14得票数 1

回答已采纳

1回答

基于分类运行的总结

r、dplyr

我正在总结大量的传感器数据。我需要提取1.)特定类别的最大运行长度和2.运行中所有变量的汇总统计信息。例如，数据： require(dplyr) fruit <- as.factor(c('apple','apple','banana','banana','banana','guava','guava','guava','guava','apple','apple','apple',

浏览 0提问于2019-07-16得票数 0

回答已采纳

1回答

如何计算平均调整后的异常收益

r、loops、return、mean

我想计算几家公司的平均调整后收益。我有每月的数据。我想计算过去12个月的滚动平均值。之后，我需要从月度回报中减去滚动平均值。首先，我使用quantmod和lapply来计算回报： library(quantmod) stocks=new.env() startDate=as.Date("2008-07-31") endDate=as.Date("2019-06-30") tickers=c("ADS.DE","DAI.DE","BMW.DE") getSymbols(tickers,src="y

浏览 1提问于2019-08-06得票数 0

1回答

基于时间和位置的SQL人流

sql、google-bigquery

我遇到了一种情况，我试图让人们通过区域流动。我有带有时间戳的数据和被系统捕获的人的位置。通常情况下，当个人位置更改时，应该将其添加到数组" path“中，如果日期在前一项之后超过一个小时，那么该行就完成了，并且应该使用该新路径启动一个新行。列"start“应该是该行使用的第一个日期，"end”应该是最后一个。原始数据： date, macAddress, zone 8h10m, 00-B0-D0-63-C2-26, room1 8h12m, 00-B0-D0-63-C2-26, hall 8h15m, 00-A0-B0-23-T2-22,

浏览 3提问于2022-08-04得票数 0

回答已采纳

4回答

在Stata / SAS中创建带有缺失值的游程平均值

time-series、sas、stata

我有几年来每小时测量环境和气象变量(温度和湿度)的时间序列。根据这些小时值，我想要计算24小时运行平均值，以创建曝光参数。为此，要求每小时至少有17个测量值可用，且连续缺失值不超过6小时。如果24小时值连续丢失6个以上，则该特定日期的数据将设置为丢失。我如何在Stata或SAS中实现这一点？提前感谢

浏览 6提问于2012-06-27得票数 2

2回答

使用dplyr计算特定日期内观测值的平均值

r、dplyr

我有一个数据集，如下所示： data <- data.frame( date = rep(c(1:10),5), obs = c(1:50) ) 其中一列包含日期，另一列包含变量obs。我想使用dplyr为每一行计算变量obs在date值的2天内的平均值，不包括当前的date行。例如，对于行13中的date = 3，我希望取date等于1、2、3、4和5的所有行，并取这些行的值obs的平均值，不包括行13中的obs的值。这将产生以下结果： mean(c(1:5, 11, 12, 14, 15, 21:25, 31:35, 41:45)) # 23.41667 您可以看到，我采用了1和5

浏览 0提问于2018-10-20得票数 0

1回答

SQL火花滞后与第一行一组的比较

sql、apache-spark-sql、window-functions

我是SQL新手，我试图计算平均值之间的差异。我想对每个项目和年份计算月份之间的差额，但我希望始终减去当前的平均--今年/项目的第一个月。例如，项目A，2020年，月份=3将有产出= 0.6，因为3.7 - 3.1 (因为这是这个项目的第一个月的值)-这是正确的方法吗？或者是滞后函数是个错误的解决方案？到目前为止，我正在尝试这个方法，但是它计算的是与前一行的差异，而不是总是使用第一个月行。 SELECT item, year, month, average, average - COALESCE(LAG(average,1) O

浏览 4提问于2020-09-22得票数 0

回答已采纳

3回答

使用SQL计算CAGR

sql

我有一个数据集，如下所示 ADVERTISER YR REVENUE --------------------------------- Altus Dental 2015 5560.00 Altus Dental 2016 48295.00 Altus Dental 2017 39920.00 我试图找到年复一年的CAGR，并取它们的平均值，这意味着 CAGR = (((REVENUE(2016)/REVENUE(2015)) - 1) + ((REVENUE(2017)/REVENUE(2016)) - 1) ) / 2 最后，我需要

浏览 2提问于2018-03-21得票数 0

2回答

找出一列离子按一列分组和按另一列排序之间的区别。

postgresql

需要查找两行列内的顺序差异和平均值，按品牌列分组和按bill_id列排序，并在单个查询中查找行之间的值列的差异。我有数据 brand bill_id worth Moto 1 2550 Samsung 1 3430 Samsung 2 3450 Moto 2 2500 Moto 3 2530 预期产出 brand bill_id worth net_diff avg_diff Moto 1 2550 0 00 Moto 2 2560 10 5 Moto 3 2540

浏览 3提问于2022-11-03得票数 0