有人能给我解释一下如何在informatica中实现以下逻辑吗?而不是在映射中使用源限定符和其他转换。SUM(WIN_30_DUR) OVER(PARTITION BY AGENT_MASTER_ID ORDER BY ROW_DT ROWS介于前30行和前1行之间)
基本上这是sql(oracle)级别的需求,但我希望是在informatica级别。
我们有一些SQL查询运行在Teradata上。现在,我们希望在Hadoop/Spark上运行这些sql查询(按原样),也许使用Apache方解石。我们在Spark (2.6.3)中和Apache方解石中尝试了这些SQL查询,但很少有查询不运行。问题是,如果我们定义一个派生变量(AS),并试图在相同级别的同一查询中使用它,那么它在SparkSQL和方解石中不起作用,而是在Teradata中工作。emps
group by EMPNO; =&g
到目前为止,我已经学会了如何合并文件,删除na,进行误差平方和,计算平均值,按组进行总结,进行K均值聚类,并绘制结果X,Y。for (i in 2:20) wss[i] <- sum(kmeans(mydata.features, centers=i)$withinss)
plot(1:20, wss, type="b", xlab="Number of Clusters", ylab=&qu