所以,我在spark中使用了Amazon Deequ,我有一个数据帧'df‘,其中有两列是'Long’类型或‘numeric’类型。我只是想检查一下: value(column1) lies between value(column2)-20% and value(column2)+20% 对于所有行 我不确定在这里放什么检查: val
假设我有list1 (1,2,3,4,5,6,7,8,9)和list2 ('a','b','c','d'),如何滤除column1等于list1中的任何值,而column2同时等于list2中的任何值的行类似于:where (column1 not in (1,2,3,4,5,6,7,8,9) and c
我有一张有柱子的桌子。我将数字存储在VARCHAR(245)列中。数字一直在变化。例如,数字可以是42或5或其他什么。它也可以有多个数字,比如42,5,20等等。我想选择其中一个数字是否存在,而不是全部。例如,如果数字是42,5,20,我希望选择列中是否存在数字42,或者选择数字4或数字5是否出现。我目前有一个查询,它只在只有一个数字的情况下才会选择:
SELECT COUNT(*) FROM TABLE WHERE