我有一个桌子结构,就像:
id | ex_name | att_name
10 | David | sam G&G
12 | John | mark hol
13 | John | john b
14 | Mark | john c
15 | David | mark hol
16 | David | mark hol
17 | Mark | sam G&G
18 | John | john b
19 | David | sam G&a
我有一个有数千行的列。我想选择最重要的一个。假设我想要选择代表我的样本的90%的所有行。我该怎么做呢? 我有一个包含2列的数据帧,其中一列用于product_id,另一列用于显示是否已购买(值为或0或1) product_id purchased
a 1
b 0
c 0
d 1
a 1
. .
. . 使用df'product_id'.value_counts()
为了获得适当的表行计数,我想使用一种简单的方法:使用count 1构造。它适用于一个简单的案例:
q)t:([]sym:`a`a`b`b);
q)select cnt: count 1 by sym from t
sym| cnt
---| ---
a | 2
b | 2
但是当我添加其他字段时,我得到了错误的结果:
q)select cnt: count 1, sym by sym from t
sym| cnt sym
---| -------
a | 1 a a
b | 1 b b
为什么count 1在一个列的情况下工作(或者只是看起来是这样),而在多个列中失败呢?
我想创建一个列,用来计算子查询中某列中唯一字符串的出现次数。但是,我不想对结果进行分组。我需要我所有的原始行。我看到其他帖子中的计数是以下面的方式选择的。我得到错误代码1146,因为table_1不存在于我的数据库中,而是来自于一个子查询。有没有人知道另一种方法?
SELECT table_1.columnA
,table_1.columnB
,table_2.CountB
,
FROM (
SELECT sometable.stuff AS 'columnA'
,sometable.morestuff AS 'colum
我有以下代码:
clear; clc;
a = [1,2,3,4,3];
b = zeros(1,5);
for i = 1:4
for j = i+1:5
if a(i) == a(j)
b = [b,i];
end
end
end
b
b是由双for循环中的连接元素产生的数组。尽管我声明了数组b = zeros(1,5),但MATLAB警告我需要预先分配b。我应该如何修改代码,以便MATLAB停止警告我进行预分配?
我想要创建一个视图来显示节点的数量(稍后我还想对一些数字字段进行求和,但是在我们可以走之前,我们不要运行)。
在我看来,我打开了聚合(在高级设置下),将显示类型设置为字段,并添加了聚合类型"COUNT“的标题字段。但是,在视图预览中,我得到了以下错误:
SQLSTATE42000:语法错误或访问冲突: 1140混合组列(MIN()、MAX()、COUNT()、.)如果没有GROUP BY子句:SELECT node_field_data.nid AS nid, COUNT(node_field_data.title) AS node_field_data_title FROM {nod
我想要创建一个查询,该查询对A和B包含相同值的行数进行计数,但只在任何给定的A出现的B> 10时。换句话说,如果我的表中有11行,如下所示:
| id | A | B | ... |
| 1 | a | a | ... |
| 2 | a | a | ... |
| 3 | a | a | ... |
| 4 | a | a | ... |
| 5 | a | a | ... |
| 6 | a | a | ... |
| 7 | a | a | ... |
| 8 | a | a | ... |
| 9 | a | a | ... |
| 10
我有DafaFrame
Col1 Col2 Col3 Col4
A B C OP
B D A JK
B C E MK
A B B LO
然后在下面得到DataFrame:
Result Total
B 5
A 3
C 2
我使用以下命令设法从每一列中获取顶级值,但不确定如何从该列获取所需的DataFrame。试图找到最好的方法来处理这个场景。
df.groupby(['Col1']).size().sort_values(ascending=False).head
我正在用C语言为大学编写一个代码,其中涉及游戏rock(0)-paper(1)-scissor(2)-ecshe(3)。这个游戏应该运行随机数字为双方的球员。最后,我必须得到一个玩家获胜的频率和摇滚乐(0)-paper(1)-scissor(2)-ecshe(3)的频率的统计数据。当我编写一段代码时,我可以获得所有的信息。但是当我使用一个函数时,我只能得到0来计算统计数据。
在其中一轮中,Player_1的值始终设置为rock(1)。该函数用于计算Player_2获得纸张(2)或剪刀(3)的次数。
长话短说:我如何创建一个函数来根据条件返回可能的答案?
int gewinn_summe_a(
假设我有一个MultiIndex DataFrame,如下所示:
X Y
A B
bar one 0.717822 -0.421127
three -0.763407 -0.306909
flux six -1.504799 0.977983
three -0.202268 1.971939
foo five 1.715336 -0.157881
one 0.942614 -1.529973
two
我有这样的疑问:
select qos.orgname, qos.org, qos.suborg, qos.Archive, qos.location, count(c.coe) AS DEPT, c.coe AS DEP,
qos.siteid, qos.admin as sitelead,
CASE When qos.Archive = 0 THEN 'Active'
when qos.Archive is null THEN '-'
ELSE 'Archi
我有一个4列的表,我想按排名排序每一列。我创建了一个如下所示的类:
public static class Fruit {
String name;
int price;
int number;
String location;
public Fruit(String a, int b, int c, String d) {
name = a;
price = b;
number = c;
location = d;
}}
我想要按等级对每一列进行排序,这意味着我可以先按名称排序,然后在同名的行中按价格排序。此外,我不仅想要从小到大对每一列进行排序,而且
假设我有一个表,其中包含以下列(A、B、C)
如何编写pig语句在列( A)上创建group by。然后过滤where count (列B> 100)和count of (distinct(列C) > 3)?
从我所拥有的:
我首先删除了B小于100的count
filter_column = FILTER data by b > 100;
然后在A上做了一个分组:
group_1 = GROUP filter_column by A;
在C列中不同值的计数大于3的情况下,现在如何过滤这个group_1?
我有一个简单的MySQL表,我想在其中运行带有where和GROUP BY条件的MySQL语法。
MySQL表:
sender destination message
| a | | b | | .. |
| b | | a | | .. |
| a | | b | | |
| a | | b | | |
| b | | a | | |
在这种情况下,如果我是“b”,我有3条消息要给我。
SELECT * FROM table
我想计算一个散列函数(使用MD5),并将结果添加到现有表中。我正在使用SSIS中的一个脚本任务来编写一个简短的C#脚本。下面是我的脚本:
using System;
using System.Data;
using Microsoft.SqlServer.Dts.Pipeline.Wrapper;
using Microsoft.SqlServer.Dts.Runtime.Wrapper;
using System.Security.Cryptography;
using System.Text;
using System.Windows.Forms;
[Microsoft.SqlServe
我不知道如何创建一个自定义字段来计算给定条件的实例。
我有一个字段ID,它以两种格式存在:
A#####
B#####
我希望创建两个列(一个用于A,另一个用于B),并按月计算实例。类似于第一列的COUNTIF ID STARTS WITH A,结果如下所示。现在,我只能创建一个包含总数的表。
+-------+------+------+
| Month | ID A | ID B |
+-------+------+------+
| Jan | 100 | 10 |
+-------+------+------+
| Feb | 130 | 13 |
我有两个MySQL表
parent and child
pid pitem
1 a
2 b
3 c
child
cid citem pid
1 aa 1
2 bb 1
3 cc 1
4 dd 2
5 ff 2
6 gg 3
我希望得到以下结果
pid pitem count records of child table
1 a 3
2 b 2
3 c 1
如何使用联接或子查询来完成它?
我试图计算某些关键字出现在(相当长的)字符串向量中的次数,并在许多不同的关键字集上这样做。
这是我工作的一个模仿者:
一列要分析的字符串,
passages <- tribble(~texts,
"Mary had a little lamb",
"Old MacDonald had a farm",
"The big friendly giant")
# A tibble: 3 x 1
texts
在过去的3个月里,我想按照下面的查询中指定的标准每周汇总一次帐户计数。以num_of_accounts和weeks作为列的表中获取这些数据的最有效方法是什么。
select COUNT(DISTINCT a.account_id) as num_accounts,
WEEKOFYEAR(a.ds) as week
FROM
(SELECT
CAST(account_id as BIGINT)
FROM
tableA
WHERE ds='2013-12-28') a
JOIN
tableB b
ON a.account_id=
我有一个occ为空的数据文件:
ID occ
a
a
b
a
b
c
现在,我想创建另一列,它将计数发生的次数,并且只显示在第一行和rest中的计数应该保持为"1":
预期结果
ID occ
a 3
a 1
b 2
a 1
b 1
c 1
在这里,a是3倍,b是2倍,c是1倍。A和b的所有其他行都将显示1。
我已经数到:
df['ID'].value_counts()
但是,当我试图使用以下方法将其放入dataframe时,它会引发一个错误:
df['occ']=df['Value'].value_counts()
我有一个For Each Cell代码,它搜索一列并根据单元格值执行操作。这可以很好地工作。我的问题是,我已经通过Google查找过,但没有用,是否有可能通过列范围而不是从上到下,而是从下到上搜索?因此,在下面的代码中,它将从B1000开始,一直到B1
Set rng = Workbooks("NX01").Worksheets(homeleague).Range("B1:B1000")
For Each c In rng.Cells
If c.Value <> "" And c.Value = hometeam Then
*(the
嗨, 在我的数据框中,有这样一列: 4,5,6,...并希望保持其增长率(0,0.25,0.2...)但是从100开始,它变成100,125和150,....对于新列中的每个元素,它都是旧列中前一个位置的元素* change rate from pct_change。我怎样才能快速做到这一点? a = pd.Series([4 ,5 , 6])
b = a.pct_change().fillna(0) 然后我想把c写成这样,但这不起作用。 c[1] = 100
for i in range(2, 5):
c[i] = c[i-1] * (1+b[i])
我有一个交易列表,其中的ID是重复的,我有购买的商品数量。我需要计算一次购买特定数量的商品的次数。 RowItmNBRTQTY112352123531235345625445619 我需要像这样产生一个输出... ItmNBRQTYOccurance12353123191123251 我可以得到结果的前两列,但是当我尝试对一个分区进行计数时,我最终得到了重复的数字,因为我只查找了9个项目,我只计算了Cnt相同的行数。 TOT_IVO_ITM_QTY
Count(*) OVER (PARTITION BY QTY) AS CNT
FROM dataset
WHERE