PARTITION BY -为组中同一列中具有两个特定值的组返回值的情况_R中具有特定列的计算组_选择特定列postgres中具有最大值的组中的行 - 腾讯云开发者社区

sql、sql-server、duplicates、common-table-expression

我有一个表，看起来像这样，我需要删除重复的，以获得最新的结果。这些不是您的标准复制项，因为没有主键或其他列，在这些列中，您正在计算相同值的相同实例。本表有一份注册球员名单，列有他们加入和离开一支球队的日期。如果列EndDate为空，则表示该球员仍在为该球队效力。 PlayerID | RegID | RegDate | EndDate | Team | LastUpdate | 1 ---------| 1 ------| 10/12/13 | 10/16/13 | Red -- | 10/16/13 -- | 1 ---------| 2 ------| 10/17/13 | nul

浏览 2提问于2014-03-16得票数 1

回答已采纳

2回答

在红移中有条件地使用窗口函数

sql、group-by、amazon-redshift、window-functions、gaps-and-islands

我有一张有以下数据的表格：链接到测试数据：我希望按照seq列指定的顺序为gid中的每个组聚合items列(使用listagg)，其条件是当pid再次成为组的0时聚合结束。也就是说，对于g1组，将有两个聚合；一个用于seq1-3，另一个用于序列4-6；因为对于g1组，pid对于seq 4为0。我期望给定示例的结果如下(请注意，结果中的seq是pid变为0的组的seq的最小值)：

浏览 3提问于2020-02-17得票数 1

回答已采纳

1回答

具有计数分组的SQL查询数据

sql、sql-server

我在一个数据库表(A至E列)中有以下数据。我需要一个查询来显示相同的列(A到E)，增加两个额外的列。在Excel中，我使用了以下公式来完成此操作，但我无法使用查询(Server)来完成该操作： =SI(CONTAR.SI(C$2:C2;C2)=1;1;0) =(CONTAR.SI.CONJUNTO(C$2:C2;C2;$D$2:D2;D2)=1)*1 A ----- B ----- C ----- D ----- E ----- COUNT (DISTINCT C) ----- COUNT (DISTINCT C&D) 1 ----- 26 -- 4650 ---- 1 ----

浏览 2提问于2015-02-10得票数 0

回答已采纳

1回答

Access 2010 SQL -分组依据/排序依据冲突

sql、ms-access

我有两个几乎相同的查询在两个不同的表中操作基本上相同的字段。第一个查询可以工作，如下所示： TRANSFORM Count(PA_20110126.Account) AS CountOfAccount SELECT PA_20110126.BuildingSegment, PA_20110126.BuildingGroup FROM PA_20110126 GROUP BY PA_20110126.BuildingSegment, PA_20110126.BuildingGroup ORDER BY Switch([PA_20110126].[BuildingSegment]='

浏览 4提问于2011-02-04得票数 0

回答已采纳

2回答

SQL查询以获取另一列中每个唯一值的最大值。

sql、sql-server

ID Sum Name a 10 Joe a 8 Mary b 21 Kate b 110 Casey b 67 Pierce 您建议为每个ID获取与最大和(按ID分组)对应的名称的最佳方法是什么。到目前为止我尝试过的是： select ID, SUM(Sum) s, Name from Table1 group by ID, Name Order by SUM(Sum) DESC; 这将把记录排列为先有最高金额的组。那我就得标记那些记录而只保留那些。有窍门或指点吗？非常感谢最后，我想得到： a 10 Joe b 110 Casey

浏览 2提问于2014-05-19得票数 0

回答已采纳

2回答

如何选择有最新日期的一行

sql、tsql、sql-server-2005

Server 2005。我有两个表，其中有以下几行的装运信息： TABLE1: SHIPMNT_NO SHIPMNT_LN_NO CUSTOMER TABLE2: SHIPMNT_NO SHIPMNT_LN_NO SHIP_DT QTY TABLE2中有多行，对于SHIPMNT_NO和SHIPMNT_LN_NO具有相同的值，但是对于发布日期(SHIP_DT)有不同的值。 SHIPMNT_NO SHIPMNT_LN_NO SHIPMNT_DT 965271 2013-02-07 00:00:00.000 965271 1 2013-02-12 00:00:00.000 965271 1

浏览 1提问于2013-02-22得票数 0

2回答

SQL查询，根据3个条件将所有记录划分为70:30的比例

sql、sql-server、tsql

我有一个表，如下： CREATE TABLE [My_Table]( [Id] int, [Amount] [money] NOT NULL, [Rate] [decimal](3, 2) NOT NULL, [Status] [varchar](50) NOT NULL, [Trend] [varchar](50) NOT NULL ) Status列有3个可能的值: A、B或C Amount列有8个潜在的值：$1.00到$8.00 Rate列有21个可能的值: 0.06到0.26 我正在尝试找出一个查询，它允许我以一种方式拆分所有行，这样我就可以得到

浏览 0提问于2016-09-03得票数 3

2回答

SQL Server 2008中的Sum函数

sql、sql-server

我有张桌子： PropertyID Amount -------------------------- 1 40 1 20 1 10 2 10 2 90 我要做到： PropertyId Amount Total_Amo

浏览 2提问于2014-01-31得票数 0

回答已采纳

1回答

根据组选择的postgreSQL最大值

sql、postgresql、select、filter

我面临着一个特别困难的(就我的技能水平而言) select查询。我在数据库中有一些数据，它们是:4列(maleName/femaleName/size/id)。列数据或多或少是不言自明的。对于每一列，我有一个男性的名字，一个女性的名字，一个尺码和一个id (它只有值1或2)。唯一的问题是男性和女性的名字(作为情侣)出现了不止一次。 Database example. # | MaleName | FemaleName | Size | ID 1 - John - Mary - 9 - 1 2 - Nick - Stacey - 6 - 1 3 - Mike -

浏览 1提问于2013-05-11得票数 0

回答已采纳

1回答

使用jQuery搜索子字符串的最快方法

javascript、jquery、search

我正在使用jQuery的DataTables插件。在DataTable中，我大约有16行tr行，每行有4个td列。例如，3，7，10，11。搜索扩展最初支持精确匹配搜索，我必须从以下位置进行修改： if (val == sSearch) 至： if (val.indexOf(sSearch) > 0) 我的自定义当然是导致性能问题的原因，但它是必要的，因为单元格的内容是动态更新的，因此无法预测执行精确匹配搜索。一个示例干草堆： <input id="_HeatOfRejection" class="form-control text-right text

浏览 2提问于2014-10-21得票数 0

1回答

使用非连续的组分区拉出第一个和最后一个值

sql、sql-server

我使用的是SQL Server 2012，有如下所示： Employee Position Month ------------------------------ John A 1 John A 2 John A 3 John A 4 John A 5 John A

浏览 0提问于2018-04-25得票数 0

回答已采纳

1回答

不同的消费者从来自Kafka主题的分区中的不同键读取数据

apache-kafka、kafka-consumer-api、kafka-producer-api

? 如果我有一个Kafka主题，其中我只有一个partitionP0，而生产者使用不同的keysk1，k2将数据写入partitionP1。假设1-1,1-2是关键字k1的值，2-1,2-2,2-3是关键字k2的值。我现在在主题的partitionP0中有1-1,1-2,2-1,2-2,2-3 我是否可以有两个不同的consumersC1，C2侦听主题中的partitionP0并读取与C1中不同keys...as关联的值C1仅读取k1的值，而C2仅读取K2的值？

浏览 18提问于2020-09-25得票数 0

1回答

清单中同一ip地址可能有不同的组名

ansible、ansible-inventory

在Ansible主机清单中，我的文件如下所示。 [all:vars] ansible_connection=ssh ansible_user="{{ username }}" ansible_ssh_pass="{{ password }}" [server_1] 125.23.49.13 [server_2] 125.23.49.13 [server_3] 145.33.39.43 我如何像server_1或server_2一样使用ip地址125.23.49.13，因为我需要这个设计，因为我将传递来自jenkins的值作为主机名和组变量位置。但是，组变量

浏览 2提问于2020-05-27得票数 0

1回答

标识许多事务的父记录

sql、sql-server、data-warehouse

这与我之前问过的一个问题有关，这个问题的滞后/领先是。然而，我正在处理的数据比我最初想象的要复杂，所以我需要一个更健壮的解决方案。这个屏幕截图显示了一个我需要解决的问题：在单个序列号中，托运事件定义了一个新的引用窗口。因此，记录2,3,4与1有关。记录6与5相关，依此类推。我需要标记那些BillToId与母货不匹配的记录。我试图理解，如果我甚至可以使用延迟函数来比较记录2,3,4回1，当装运后事件的数量变化时(允许重复)。我在想，我最好还是用另一个事实表来先识别每条记录的父级rowid？那么，我的问题就变成了如何有效地识别每一行属于哪一批货物？我是否被迫对每条记录运行子查询？我

浏览 2提问于2014-02-07得票数 0

回答已采纳

1回答

如何从巨大的表(100亿行)中加快连接和分组

mysql、query-optimization、database、nosql

我有一个包含两个列的链接表，用户组(用户int，组int)包含大约100亿行。每一列都有一亿个独特的值。在这两个字段上都创建索引。我必须找到用户数最多的组，它们属于指定的组。我的疑问是 select group_id, count(*) as cnt from usergroups GM join (select user_id from usergroups where group_id=74437 LIMIT 100) G on (GM.user_id=G.user_id) group by group_id having cnt > 10 o

浏览 1提问于2014-11-05得票数 2

1回答

SQL报表生成器:如何合并组？

sql-server、reportbuilder3.0

我有两个报告，一个是我创建的，另一个是作为指南/模板使用的。在模板报告中，列分组似乎是“合并”的，但这可能不是适合这种情况的术语(因此我在搜索这一点时遇到了麻烦)。下面是我的模板的样子：模板不过，我的看上去有点不同。我有我的年度和月份分组，但是如果我合并它们(通过选择两个单元格并在布局部分中单击merge )，我就失去了" month“组。下面是我的样子：矿场那么，我如何模仿模板的样式呢？我看到模板中的两个组都有括号，而在我的模板中，括号只存在于我的子组。这是我的问题吗？这意味着什么？为了进一步清楚起见，下面是我试图让输出看起来像什么( 8/201

浏览 1提问于2019-09-23得票数 0

回答已采纳

1回答

按多列分组，从每组的最后两行获取组总计数和特定列。

sql、sql-server

我有一个具有下列列的Server表： Notification =================== Id (int) UserId (int) Area (int) Action (int) ObjectId (int) RelatedUserLink (nvarchar(100)) Created (datetime) 目标是创建一个查询，将特定用户的相同区域、Action和ObjectId的通知分组(UserId)，并返回一行，包括组<code>E 210</code>的总数，以及最后两行<code>E 212</code>的特定列的&l

浏览 5提问于2016-04-08得票数 2

回答已采纳

2回答

如何获取x和y之间的列的选定行

sql、sql-server、sql-server-2005

我正在尝试编写一个查询，该查询根据另一列的x和y行值返回所选列的行。但是下面的查询将返回两个选定列的所有行，即使我已经指定了一个范围。有人能告诉我我做错了什么吗？ select username, password from loginuser group by username, password having count(id) between '1' and '2'

浏览 0提问于2011-02-13得票数 0

回答已采纳

1回答

如何在使用弹簧云流运动时设置PartitionKey

spring、spring-cloud、spring-cloud-stream

在我的代码中，我使用了setHeader。 mysource.getChannel1() .send(MessageBuilder .withPayload(new Person("messageA", 1)) .setHeader("partitionKey", 345).build()); 我在属性文件中添加了： spring.cloud.stream.bindings.channel1.producer.partitionKeyExpression =

浏览 2提问于2018-03-13得票数 3

2回答

如何使用组BY选择带有TSQL查询的其他列

sql、sql-server、tsql、group-by

我有一个视图(这是几个表的结合)，我需要过滤掉重复的表。这张桌子是这样的： id first last logo email entered 1 joe smith i.jpg e@m.c 2014-01-27 2 jim smith b.jpg e@j.c 2014-01-27 3 bob smith z.jpg b@b.c 2014-01-27 9 joeseph smith q.gif e@m.c 2014-01-20

浏览 4提问于2014-01-27得票数 0

回答已采纳

1回答

查找重叠的列/行集

python、numpy

背景：这个问题使中的问题更进一步。假设我有一个2D数组，其中列被划分为几个集合。为了简单起见，我们可以假设数组包含int值，如下所示： np.random.randint(3,size=(2,10)) # Column indices: # 0 1 2 3 4 5 6 7 8 9 array([[0, 2, 2, 2, 1, 1, 0, 1, 1, 2], [1, 1, 0, 1, 1, 0, 2, 1, 1, 0]]) 作为对列索引进行分区的示例，我们可以选择以下内容： # Partitionin

浏览 4提问于2013-08-12得票数 2

回答已采纳

1回答

如何从microsoft数据库中删除重复数据(仅针对结果)

sql、sql-server、duplicates

列代码中有重复的值，我确实想删除该行的重复。例如，我希望删除列代码的重复项，以及其中包含重复的行。如果另一列有重复，这并不重要，但我确实希望将其建立在代码列的基础上。我可以使用什么sql查询？谢谢如您所见，在它们上有值为1的isdeleted列。我只希望它们上的值为0。这里是一个示例记录，在这里您可以看到第1行的isdeleted值为1，这意味着该记录被删除，而我只需要这段代码的第2行。

浏览 5提问于2021-04-29得票数 0

回答已采纳

2回答

在给定分区内用以前的NULL值替换空值

sql、sql-server、sql-server-2019

如何计算新列，其中来自Number列的Number值将被替换为以前的非空列？NULL的不应保持不动。都在Customer的分区内。 +----------+------------+--------+ | Customer | Date | Number | +----------+------------+--------+ | A | 2016-01-01 | 9,00 | | A | 2020-01-01 | NULL | | A | 2020-01-15 | 10,00 | | A | 2020-02-01

浏览 3提问于2020-06-10得票数 0

回答已采纳

3回答

选择不同的列( sql server )

sql、sql-server、tsql、distinct、distinct-values

我有一个包含identity primary key id、CNum、CUID和其他列的表。我想要基于CNum和CUID选择不同的记录，换句话说，如果两个记录具有相同的CNum和CUID，我想得到最上面的记录，我试着按其分组，但是它不会工作，因为希望整个行。 with a as (SELECT distinct CNum, CUID FROM Con) select c.CNum from Con c inner join a on a.CNum = c.CNum and a.CUID= c.CUID order by id 这种方法仍然得到重复的记录。有人知道怎么解决这个问题吗？

浏览 2提问于2014-04-28得票数 0

回答已采纳

1回答

如何找到按多列分组时的平均值？

sql-server、group-by

我有两个临时表，#dates和#availability，以及一个日期变量@startdate。变量是： declare @startdate datetime = '2016-12-20' #dates的列和数据是： Date ------- 2016-12-20 2016-12-21 2016-12-22 #availability列和数据如下： GroupId Date StatusId Price ----------------------------------------------- 111 2016-12-2

浏览 2提问于2016-11-15得票数 0

回答已采纳

2回答

SSIS带条件的新列

sql、sql-server、sql-server-2008、ssis

我已经使用派生列Record_Type as (DT_WSTR,25)"“数据类型创建了一个新列，然后使用另一个派生列创建了我的条件Record_Type is PRDCT_IND == TRUE？"PRIME“："SEC”。可以在一个派生列中同时创建这两个对象吗？感谢你的帮助。 343

浏览 2提问于2012-10-18得票数 0

回答已采纳

1回答

根据所描述的场景征求对数据库表设计的建议

database-design、relational-database、database-performance、sharding、large-data-volumes

可能是个奇怪的情况，但我突然想到. 想象一下，我有一个数据库表，每天需要100万新行。表中有3列: id、value、date。对于这些行，我想要做的是根据日期加载所有行。以下是一个问题：考虑到这个表的性质和我使用它的方式(我只需要在特定的一天获取行列表)，从性能上讲，创建一个具有相同结构但以日期命名的新表(即创建名称为01Jan2014，02Jan2014，.(每个记录中有100万条记录)是否利用了将表和日期列中的所有行作为索引的优势？

浏览 1提问于2014-01-15得票数 1

回答已采纳

1回答

基于日期时间场年准则的分块表

sql-server、ssis

我正在创建一个SSIS包，它执行存储过程，并将其结果存储为目标数据库中的表FinancialStatementIds。该表已存在于目标数据库中。我需要对目标表进行分区，并为此编写了一个脚本。我正在获取过去五年的信息，并根据年份存储每个分区。因此，我已经创建了5个分区，它排除了主分区，并且分区被设置为列周期日期，这是一个datetime字段。你能确认一下它是正确的吗？我需要在分区表中添加其他列吗？我还想知道脚本如何知道它必须对FinancialStatementIds表进行分区。基座表 USE CoreReferenceStaging; GO -- Adds four n

浏览 2提问于2017-10-22得票数 1

2回答

SQL查询以标识1后面的0

sql、teradata

假设我有两列：Date和Indicator 通常是从0到1 (当数据按日期排序时)和，我希望能够识别它是否从1到0，而不是。有什么简单的方法可以用SQL来完成这个任务吗？我已经在同一表中汇总了其他字段。如果我可以将它添加到另一个聚合中(例如，不使用单独的"where“语句或第二次传递数据)，那就太棒了。这就是我想要捕捉到的现象： Date Indicator 1/5/01 0 1/4/01 0 1/3/01 1 1/2/01 1 1/1/01 0

浏览 5提问于2015-03-09得票数 1

回答已采纳

2回答

Server选择表中的所有值，而不让它们在组中

sql、sql-server、join、group-by

所以这个问题也许已经得到了答案，但是要寻找它甚至是问它有点困难。我想通过多种方式查询一个表并对其进行过滤。在下面的例子中，我想知道每个部门的第一个雇员是谁。 Table A下面的示例表 employee_id | dept_id | start_date | name | age | sex 1 | 1 | 1/5/2000 | Bill | 25 | m 2 | 2 | 2/5/2000 | Biff | 30 | m

浏览 4提问于2014-01-25得票数 1

回答已采纳

1回答

hadoop提供的默认哈希分区程序的替代方案

hadoop、hash、hadoop-partitioning

我有一个hadoop MapReduce程序，它不均匀地分配密钥。一些reducers以两个键结束，一些只有一个键，而另一些则没有。如何强制hadoop将具有特定键的每个分区分发到单独的reducer。我有9个表单的唯一密钥： 0,0 0,1 0,2 1,0 1,1 1,2 2,0 2,1 2,2 我设置了job.setNumReduceTasks(9)；但是散列分区程序似乎将两个键散列到相同的散列码，导致重叠的键被发送到相同的缩减程序，并使一些缩减程序处于空闲状态。随机分割器能解决这个问题吗？它会将每个唯一的密钥发送到一个随机的reducer，以保证每个reducer接收一个密钥。如何启用

浏览 0提问于2018-04-20得票数 1

2回答

是否将SQL Server结果集转换为输出参数？

sql-server-2008

我有一个执行select语句的存储过程，结果是我分配给输出参数的单列和单行。现在，存储过程必须增长到从单行结果集中返回两列。保持单个select (只是让它返回两列而不是一列)并将两个行值分配给独立(输出)变量的最干净的方法是什么？谢谢。

浏览 2提问于2011-11-02得票数 1

回答已采纳

2回答

使用同一表中的另一列更新一个列，其中包含Server中的两个项(值)

sql、sql-server

我试图从同一个表中名为Product_Group的列中更新一个列Product。这个Product列有两个条目，Simple或Others。在Invoice表中显示如下：我遇到的问题是，如果您查看Top_Level ID 10、19、21和31有多个条目，并且产品也是多个(即简单的和其他的)。我想要实现的是，当我看到Top_Level有Simple和其他人，然后将Product_Group列更新为"Simple/Other“ 我怎样才能做到这一点？

浏览 0提问于2018-10-07得票数 3

回答已采纳

3回答

是否将数据库值和单元作为两个单独的列？

database-design

我想将计算机的处理器速度存储在数据库中。我是否应该使用一列作为varchar并将数字和单位存储在一起，例如"1.3 ghz“ 或我是否应该创建两个单独的列，一个作为小数"1.3“，第二个列作为varchar "ghz"？

浏览 1提问于2010-08-25得票数 1

回答已采纳

2回答

按分区列的顺序划分

sql、window-functions

我有一个窗口函数，如下所示： SUM(value) OVER ( PARTITION BY product, service, site ORDER BY region, site, service, product, year, week ASC ROWS BETWEEN 12 PRECEDING AND 0 PRECEDING ) AS value 查询工作正常，但我想了解更多的窗口函数，我有两个问题：是否将分区列按产品、服务、站点进行排序？，我需要从order BY子句的第1点指定列还是可以省略它们？

浏览 7提问于2022-11-12得票数 0

1回答

使用派生表和CTE显示详细信息？

tsql、sql-server-2012

我在教自己the，并且很难理解下面的例子。假设您希望显示几个非聚合列以及一些适用于整个结果集或更大的分组级别的聚合表达式。例如，您可能需要从Sales.SalesOrderHeader表中显示几个列，并计算每个销售相对于所有客户销售的TotalDue所占的百分比。如果按CustomerID分组，则不能包含来自Sales.SalesOrderHeader的其他非聚合列，除非按这些列分组。为了解决这个问题，您可以使用派生表或CTE。这里有两个例子..。 SELECT c.CustomerID, SalesOrderID, TotalDue, AvgOfTotalDue, TotalDu

浏览 1提问于2013-09-25得票数 0

回答已采纳

2回答

选择SQL逻辑

sql、sql-server-2012

这里的人不知所措！首先，这是我想要达到的目标：从如下所示的表CUSTOMER_ORDER_DETAILS表中选择所有记录，如果存在相同CUSTOMER_NO的多个条目，则：选择带有PAID =1的条目如果有多个付费=1项，则选择类型为=Y的记录预期结果： 877，CU115，lit，0，1，X 878，CU111，Toi，1，1，Y 879，CU117，Fla，1，1，X 我的方法是在Select语句中使用GROUP获得count( CUSTOMER_NO ) > 1，但是一旦我将表的其余列添加到Select语句中，count列就会显示值1。

浏览 2提问于2017-04-19得票数 1

回答已采纳

1回答

MySQL 5.5 (InnoDB)的分区策略

mysql、innodb、partitioning

尝试为MySQL 5.5 (InnoDB)表实现分区策略，但我不确定我的理解是否正确，或者在创建分区时是否需要更改语法。表"Apple“具有10个磨机rows...Columns "A”到"H“PK是列"A”、"B“和"C”。列"A“是一个字符列，可以标识200万行的组。我认为列"A“将是尝试实现分区的一个很好的候选者，因为我按该列进行选择和删除，并且在不再需要数据时实际上可以截断该分区。我发出了这个命令: ALTER TABLE Apple PARTITION BY KEY (A)；使用以下命令查看分区信息后:从INFO

浏览 2提问于2011-11-25得票数 1

回答已采纳

1回答

BigQuery计数不同的ColX不等于ColX的组计数

sql、google-bigquery

我的印象是，如果要在某一列上执行COUNT(DISTINCT xyz)，它将等于对该列的GROUP BY的常规计数。但是，当我在BigQuery中的一个非常大的数据集上这样做时，在完全相同的条件下，结果会显示出很大的差异： Query Type Count ---------------------------------- - count(distinct ColX) > 7 million - count(ColX) ... GROUP BY ColX ~ 6.5 million 为什么会这样呢？我认为在列中计算唯一值的这两个不同版本应该返

浏览 2提问于2015-09-07得票数 3

回答已采纳

1回答

sql server更新同一表中重复的行。

sql、sql-server

我希望我能很好地解释我的问题。我有一张没有主键的桌子。为了获得唯一的行，我必须将select distinct (make, model, category,onhand)放在一起，结果是每个行都有两个行，每个行都有现成的is null和另一个现成的is not null。现在我要做的是为每个重复的行将我的表更新为set null onhand = onhand with value 我有一个查询来查找每个副本-2 select distinct MAKE, MODEL, category, PRGR, CountDuplicateRows= COUNT(1) --column

浏览 4提问于2014-02-13得票数 0

回答已采纳

2回答

“规范化”和“规范化”数据之间是否有明确的区别？

normalization、canonicalization

我理解规范化和规范化意味着删除数据表示中的任何无意义或不明确的部分，从而有效地将相同的数据转化为实际上相同的数据。例如，如果您想获取某些输入数据的哈希，并且其他对规范相同数据进行散列的人获得相同的哈希是很重要的，那么您不希望一个文件缩进选项卡，而另一个文件使用空格(没有其他区别)导致两个非常不同的散列。在JSON的例子中：对象属性将按标准顺序(可能按字母顺序排列)放置。不必要的空白将被剥夺。缩进标准或脱去这些数据甚至可以用一种全新的语法重新建模，以强制执行上述操作。我的定义正确吗?术语是可互换的吗？或者，在输入数据的canonicalization和nor

浏览 0提问于2019-03-21得票数 8

1回答

更改选择列表会影响所选记录。

sql、sql-server、sql-server-2008

我有一个疑问如下..。 select * from (select COL1, COL2, COL3, ROW_NUMBER() OVER (PARTITION BY COL2,COL3 ORDER BY COL2,COL3) AS rn from TABLE ) t where rn = 1 返回预期的结果。当我修改外部select以显式请求列时，没有行号列，因此. select COL1, COL2, COL3 from from (select COL1, COL2, COL3, ROW_NUMBER()

浏览 1提问于2016-02-17得票数 0

回答已采纳

1回答

要根据多列在组中找到最佳行的SQL？

sql、oracle、greatest-n-per-group

假设我有一个Oracle表，其中包含不同类别的度量： CREATE TABLE measurements ( category CHAR(8), value NUMBER, error NUMBER, created DATE ) 现在，我希望在每个类别中找到“最佳”行，其中“最佳”的定义如下：它有最低的错误。如果有多个具有相同错误的度量，那么最近创建的度量被认为是最好的。这是问题的一个变体，但包含两列而不是一列。我如何用SQL来表达这一点？

浏览 0提问于2019-03-01得票数 0

回答已采纳

13回答

SQL Server:分区依据和分组依据之间的差异

sql-server、tsql、aggregate-functions、window-functions

多年来，我一直在将GROUP BY用于所有类型的聚合查询。最近，我对一些使用PARTITION BY执行聚合的代码进行了逆向工程。通读我能找到的关于PARTITION BY的所有文档，它听起来很像GROUP BY，也许添加了一些额外的功能？它们是相同通用功能的两个版本，还是完全不同的东西？

浏览 1提问于2010-03-09得票数 418

回答已采纳

2回答

如何获得每个分区的最后值，以便在spark中计算缺失的值

sql、apache-spark-sql、window-functions、gaps-and-islands

我有一个样本数据，在这里我要计算丢失的值。数据丢失的行由blank表示。这是样本数据- val my_df = spark.sql(s""" select 1 as id, 1 as time_gmt, 'a' as pagename union select 1 as id, 2 as time_gmt, 'b' as pagename union select 1 as id, 3 as time_gmt, 'blank' as pagename union select 1 as id, 4 as time_gmt,

浏览 0提问于2020-12-01得票数 0

回答已采纳

1回答

MySQL表分区与地板函数(不允许分区功能)？

mysql、function、range、database-partitioning、floor

我正在尝试使用以下范围函数创建一个分区表 CREATE TABLE `fact_events` ( `event_key` bigint(20) unsigned NOT NULL AUTO_INCREMENT, `event_type_key` tinyint(3) unsigned NOT NULL, `analytic_file_id` bigint(20) unsigned NOT NULL ', `sdk_session_id` bigint(20) unsigned NOT NULL, `virtual_button_create_id` bigint(20) unsign

浏览 2提问于2013-06-30得票数 1

1回答

交叉连接的不同值？

sql、database、oracle

如何获得Oracle交叉联接的第一个X不同组合:如果存在值为(a, b)的行，则X中没有重复a或b的其他列在我的例子中，我有两个带有1000 * 1000 = 1,000,000组合的表，但我只想要前500个唯一的对。这些情况似乎发生在ROWNUM = 1,1001,2001,3001等地方。我有一个客户和图书表--我想生成500个随机的图书销售表，这个表将客户/书籍都引用为FKs，这样就有500个独特的客户，500个独特的书籍。我已经做了一个交叉连接的客户到图书，但这提供了一个笛卡儿乘积的所有图书/客户组合。我如何获得500个独特的客户和500个独特的书籍？谢谢。

浏览 0提问于2021-03-29得票数 1

回答已采纳

2回答

SQL按一个条件对N条记录进行排序，并按另一条条件对N条记录进行排序，然后重复

sql、loops、ranking

在我的表中，我有4列Id，类型为InitialRanking & FinalRanking。基于某些标准，我已经设法将InitialRanking应用于记录(1-20)。我现在需要应用FinalRanking，方法是识别类型1的前7位，后跟 ? 类型2的前3名。然后我需要重复上述步骤，直到所有记录都有一个FinalRanking。我的目标是在附加图像的最后一列中实现输出。 7和3会随着时间的推移而变化，但出于本例的目的，我们假设它们是固定的。

浏览 15提问于2018-12-28得票数 0

3回答

难以找到正确的WHERE条款

sql、sql-server-2008、ssrs-2008

我正在为SQL查询而挣扎，我需要您的帮助。老实说，我开始怀疑我想要实现的目标是否能像我现在这样做，但也许你们的集体头脑能想出一个比我的更好的解决方案，并证明我在一开始就走了一条好路(或者我完全错了，我应该从头开始)。数据集一行有4个重要字段：ItemID、Item、Priority和Group。这些字段包含唯一有价值的信息，即最终将显示的信息。由于我使用的是Server 2008，所以我无法访问LAG和LEAD函数，所以我需要模拟它们(或者至少，我这样做是因为我认为它对我很有用，但我不太确定了)。为了获得这个结果，我使用了来自的代码，它为您提供了一个LAG和LEAD等价物，我将其限制为一

浏览 7提问于2017-08-22得票数 1

回答已采纳

3回答

如何从表中选择所有列并计数？

sql、postgresql、count、greatest-n-per-group、window-functions

我正在尝试选择表top_teams_team中的所有列，并获取hash_value列的值计数。这里的sql语句部分起作用，因为它返回两个列，hash_value和total。我仍然希望它能给我表中所有的列。 select hash_value, count(hash_value) as total from top_teams_team group by hash_value 在下面的sql语句中，它给出了所有的列，但是显示的是重复的hash_value，这不是我想要的。我试着把distinct关键字放进去，但是它没有正常工作，或者我没有把它放在正确的位置。 select * from top

浏览 1提问于2019-09-22得票数 1

回答已采纳