我希望根据某些条件对DataFrame进行分组,然后在第一行的组(而不是DataFrame)中找到满足某些谓词的整数索引。如果没有这样的行,我想得到NaN。
例如,我按列将a除以5,然后在每个组中查找第一行的索引,其中b列为“红色”:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': xrange(12), 'b': ['red', 'green', 'blue'] * 4})
a b
0 0 red
我有一个表,它有两个重复行(总共有3行),所以我使用下面的代码在列中获得重复值。
SELECT CustNo, COUNT(*) TotalCount
FROM Rental
GROUP BY CustNo
HAVING COUNT(*) > 1
ORDER BY COUNT(*) DESC
因此,一旦获得了重复值,就需要从customer表中获得作为复制派生的CustNo。如何使用这个值,并在select语句中使用它,所有这些都在同一个查询中。我也准备了这样的select语句。
Select * from Customer where CustNo = 'T0002'
我的sql查询是
SELECT
dim_location.country_name,
COUNT(fact_flight.sk_fact)
FROM
dim_date, dim_location
INNER JOIN fact_flight ON dim_location.sk_location = fact_flight.sk_fact AND
dim_date.date_key = fact_flight.date_key
WHERE
fact_flight.date_key = dim_date.date_key
GROUP BY
我想要实现一个运行的值,但是条件会在某些特定的列值上重置。
以下是我的select语句:
with tbl(emp,salary,ord) as
(
select 'A',1000,1 from dual union all
select 'B',1000,2 from dual union all
select 'K',1000,3 from dual union all
select 'A',1000,4 from dual union all
select 'B',1000,5
我需要聚合我的dataframe的两列,计数第二列的值,然后只取" count“列中值最高的行,让我显示:
df =
col1|col2
---------
A | AX
A | AX
A | AY
A | AY
A | AY
B | BX
B | BX
B | BX
B | BY
B | BY
C | CX
C | CX
C | CX
C | CX
C | CX
------------
df1 = df.groupby(['col1', 'col2']).agg({'col2
我有以下代码
SELECT C_Record.BunchOfColumns, Count(*) AS Degrees
FROM C_Record
WHERE (((C_Record.[C#])=[Enter Value])) //Parameter Input from User
GROUP BY C_Record.BunchofColumns;
“我的学位”列从不增加,它总是显示1,无论从查询中返回多少行。我怀疑我没有正确地实现我的GROUP BY方法。如果我正确理解它,所有被选中且不是聚合函数一部分的列(在我的例子中是COUNT)都应该放在GROUP BY中。任何帮助都是非常感谢的。提前