我的背景是数据库和SQL编码。我用过一点SPSS中的CTABLES特性,主要是用来计算百分位数,这在sql中很慢。但现在我有了一个数据集,其中我需要计算加权平均值的百分位数,这并不简单,而且我不知道这在SPSS中是否可行。
我有类似于下面的数据
Country Region District Units Cost per Unit
USA Central DivisionQ 10 3
USA Central DivisionQ 12 2.5
USA Central DivisionQ 25
我在一个SQL数据库中有几个表,我希望有另一个表(例如,Stats),它将对这些表(平均值、计数等)保存一些统计数据。
每次修改一个表时,我都可以对X进行更新,如下所示:
INSERT INTO Things VALUES (x, y, z);
UPDATE Stats
SET AverageX = (SELECT avg(x) FROM Things WHERE Things.y="identifier")
WHERE Stats.y="identifier";
但这似乎有点低效(每次平均)。此外,Stats可能不会包含与Stats.y=
我在数据库(test.db)中有一个表(x),其中有三个列(name、rate、recorded_at)。
这个表中大约有500行,我正试图得到添加的最后30条条目的平均值。我知道我可以通过使用熊猫来获得所有条目的平均值,但我很难找到如何对数据进行排序,然后从结果中得到平均值。
import sqlite3
conn = sqlite3.connect('test.db')
c = conn.cursor()
c.execute("SELECT rate FROM x ORDER BY recorded_at DESC")
result1 = c.fetc
坦率地说,我一直在思考如何实现一些超出我数学能力的东西。因此,在这里,请随时尝试并为我指出正确的方向,而不是完整的代码解决方案,任何我都会感激的帮助。
因此,假设我对文本进行了分析,并生成了不同两个字符组合的频率表。我将它们存储在一个26x26的数组中。例如:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
A 1 15 (frequency of AA, then frequency of AB etc.)
B 12 0 (freq of BA, BB etc..)
... etc.
所以我想随机选择这两个字符的组合,但我想根据频率
我正在尝试创建一个SQL触发器函数,当数据插入到原始表中时,该函数应该更新辅助表。更新将基于“金额”和“store_id”列。
我有下表来存储在被表示的两个商店中发生的每一个事务。
CREATE TABLE transactions(
payment_id INT NOT NULL PRIMARY KEY,
payment_date TIMESTAMP NOT NULL,
store_id INT NOT NULL,
amount FLOAT NOT NULL
);
当插入完成时,我希望我的store_averages表也要更新表示平均值的平均值。该表的创建方式如下:
我在一个表中有日,月,年,值列,这里我需要得到一个月内每周的平均值。如何做到这一点。关于这一点,请帮助我。
select avg(value) from table group by month
给出月平均值。
select avg(value) from table group by day
给出日平均值。但是如何从月份字段中获取周平均值。
将计算过的数据存储在每一行中是不好的做法,还是在应用层对数据库的每次读取进行计算更好。
存储在数据库中可以避免多次计算,但如果出现错误,则需要更新数据,而不仅仅是更改应用程序级别的计算。
我认为后者更好,但有一般的经验法则吗?
例如,我需要计算食物的每日总营养摄入量。因此,各种portions of energy of foods。我可以根据对应的food计算D4能量,并将每个portion的energy存储在portions表中,也可以每次使用相应的food从连接中计算。
你可以想象,如果你需要计算很长一段时间的年平均值、月平均值、日平均值等,它可能会变得相当笨拙。
如何使用物化视图,当每一