我想使用SAS/ACESS 9.3M2接口连接sas和我的蜂巢。我的问题是,sas是否将蜂巢立方体导入到sas环境中并在那里进行查询?或者,为了报告的目的,它再次命中蜂巢,从而运行MR,从而将我的报告性能降低到超过2-4秒。
如果它将蜂窝表导入到它的环境中,那么与普通的sql多维数据集相比,它的性能如何?
我对sas完全陌生,我希望在2-4秒内生成我的报告,其中我的聚合数据位于Hive表中,然后我在此基础上创建了多维数据集。
谢谢..。
发布于 2013-08-21 15:14:01
SAS/ACCESS的作用是:--为您提供读取数据和从数据源写入数据、处理数据类型转换的能力--提供关于数据存储的元数据(表、字段、数据类型的列表)--提供一个将(也是部分)转换(隐式通过) SAS代码到数据源特定代码(通常是SQL变体等)的能力--为您编写特定于数据源的代码并从SAS发送它以在数据源中执行。
我对Hadoop完全陌生:-)所以我只想猜测SAS/Access对Hadoop (通过LIBNAME语句)从Hadoop读取关系数据,文档中提到JDBC,所以我猜这是用于数据访问的。我怀疑SAS/Access是否能够查询Hadoop中的多维数据集(这是您的问题吗?--“我已经在此基础上创建了多维数据集”--在Hadoop中是指?)。
通常,SAS/Access试图最小化来自数据源的数据传输,并尝试将处理推送到数据源。
来自http://blog.cloudera.com/blog/2013/05/how-the-sas-and-cloudera-platforms-work-together
SAS/访问Hadoop
SAS/ACCESS提供了访问存储在SAS中Hadoop中的数据集的能力。使用SAS/访问Hadoop:
LIBNAME statements can be used to make Hive tables look like SAS data sets on top of which SAS Procedures and SAS DATA steps can interact.
PROC SQL commands provide the ability to execute direct Hive SQL commands on Hadoop.
PROC HADOOP provides the ability to directly submit MapReduce, Apache Pig, and HDFS commands from the SAS execution environment to your CDH cluster.
SAS/ACCESS接口可从SAS9.3M2版本中获得,并支持CDH3U2以及CDH4.01及更高版本。
在http://support.sas.com/documentation/cdl/en/proc/65145/HTML/default/viewer.htm#p1esotuxnkbuepn1w443ueufw8in.htm上也可能有帮助
https://stackoverflow.com/questions/18358722
复制相似问题