我为这个令人费解的标题道歉,我是SQL的新手,我真的不知道如何比这更好地问它。
从本质上讲,我有一个非常大的表,其中有很多列。我需要找到任何选定列的值的平均值,但前提是该行的ID具有特定的日期。
例如,我编写了这个简单的查询来按日期查找列的平均值……
SELECT AVG(Col6), date
FROM Schema.Table
WHERE date = 2019
这将返回日期列中包含2019的所有日期的Col6平均值。
日期列中有两年(2019年和2020年)。有些ID没有2019年的数据,有些没有2020年的数据。
我想写一个查询,如果一个ID有2020年的日期和2019年的日期,基本上
我有一个来自盗版数据集的关系,其中包含以下字段:
date, country_code, torrent_id, first_seen, torrent_size, quality, movie_id, value
我想按日期、国家、电影和质量分组,以计算总和。但我也想计算最小,最大,torrent_size的平均值为所有激流的电影在那一天。
这就是我到目前为止所得到的
A = FOREACH (GROUP data BY (date, country_code, movie_id, quality)) {
GENERATE group, SUM(data.value) as tota
我是PowerQuery的新手,我有一个表,它本质上是那些天内日期和小时的矩阵:第一列保存每个日期,其余的列标记为1到24。一个例子是:
Date H1 H2 H3 H4 ...
---- -- -- -- --
Jan 1
Jan 2
Jan 3
...
它存储在一个非常大的Excel文件中,因此我希望能够简单地查询该文件并提取数据的子集。一个例子是按年计算的平均小时数。在SQL中,这将由"SELECT年份(日期)、AVG(H1)、AVG(H2)、.从源表GROUPBY年份(日期)“表示。但是,在PowerQuery中,您似乎只能使用GROUPBY生成
我用数组作为数据源构造了一个alasql查询。表中的列(带有1000+行)如下:
City,TravelDate,Q1,Q2,Q3,Q4
1,2015-05-31,6,6,5,5
我的要求是找到按城市、年份和月份分组的问题(6岁以下)的平均值。
+仅适用于某一日期范围的
[]包含数组中列的索引号。
到目前为止,我的问题是:
var res = alasql('SELECT [11] as City, [0], AVG([1]), AVG([2]),AVG([3]),AVG([2]) FROM ?D WHERE [1] <= 5 AND [2]<= 5 AND [3]<
假设我有一个名为df的数据框架,如下所示:
id x y
1 10 A
2 12 B
3 10 B
4 4 C
5 9 A
6 15 A
7 6 B
现在我想将数据按y列分组,并得到每个组的2个最大值(x)的平均值,其结果如下
y
A (10+15)/2 = 12.5
B (12 + 10)/2 = 11
C 4
如果我试着用df.groupby('y')['x'].nlar
我一直在尝试编写一个关于大型查询的查询,以获取两个时间(创建于和解析于)之间的差异,并获得按天分组的平均值。 这是我写的查询: SELECT
avg(datetime_diff(datetime(stats.resolved_at), datetime(created_at), HOUR)) as Difference,
date(tickets.created_at)
FROM fresh_desk.tickets
WHERE
type = "Revision Request"
OR type = "Proof reques
我已经创建了一个SSRS报告,它是按日期和时间列分组的。日期作为父组,时间作为子组。此外,我还从select语句的某一列中提取了日期和时间,如下所示:
CONVERT(VARCHAR(10),DetectionTime,103) AS Detection_Date,
CONVERT(TIME(0), DetectionTime) AS Detection_Time
此外,我创建了参数,并使用此链接中的以下代码找到了给定字段中的唯一值,并按照上述步骤从给定参数中删除了重复项:-
Public Shared Function RemoveDuplicates(parameter As Param
我有两个pandas.dataframes df1和df2。他们的一些指数是相等的。我希望找到这些索引,并将相应的行合并到一个新的dataframe。
df1 =
A B
Name
apple 1 5
orange 2 6
banana 3 7
df2 =
A B
Name
apple -1 10
audi -2 11
bmw 0 12
banana 2 8
vw -3 6
我想要的新数据是: 1)查找具有相同索引的行;2)计算列'A‘中相应行的平均值。
df_ne
我想将一个日期列表分成几个小时,然后像平均值一样执行操作。我已经编写了一个调用sqlite3数据库的python程序,查询返回一个列表:
def SQLQueryDaily(currency,start,end):
#year = start[0,3]
c.execute('SELECT buy, sell FROM '+currency+' WHERE (datetime > "'+start+'" AND datetime < "'+end+'")')
for
我有一个数据文件,它的值分散在几个列上。我想要计算特定列中所有项的平均值。
我查找的所有解决方案最终都给了我每一列的单独平均值或所选列的平均值。
我的Dataframe看起来是这样的:
Name a b c d
Alice 1 2 3 4
Alice 2 4 2
Alice 3 2
Alice 1 5 2
Ben 3 3 1 3
Ben 4 1 2 3
Ben 1 2 2
我希望看到b&c列中每个“Alice”值的平均值:
当我
如何将以下sqlite查询转换为核心数据
select name, firstname, class, telephone, entryDateTime, counselor, count()
from myTable
group by strftime('yy-mm-dd', entryDateTime), name, class, counselor
order by entryDateTime desc;
我想按日期(yy-mm-dd)、班级、辅导员和姓名分组。entryDateTime使用协调世界时,但它应该转换为本地时间。
提前感谢