我正在测试谷歌应用程序接口中的BigQuery,想在维基百科上运行一些查询全文转储。谷歌样本数据不包括全文转储(只包括修订历史)。
维基百科转储的来源很少,比如亚马逊上的这个:http://aws.amazon.com/datasets/2506
我的问题是:有没有一种方法可以查询这些数据集而不将它们传输到谷歌BigQuery项目?等同地,BigQuery有一种方法可以直接与这些数据集之一通信吗?
如果BigQuery不可能做到这一点,那么亚马逊EC2中有没有同等的服务可以做同样的事情呢?
谢谢。
发布于 2013-01-15 04:33:04
谷歌有没有一种方法可以查询这些数据库而不将它们转移到
BigQuery项目中?
不是的。BigQuery对BigQuery项目和数据集进行操作。
同样,BigQuery有一种方法可以直接与这些数据集之一进行通信吗?
等同地,不。出于完全相同的原因。
如果BigQuery不可能,那么亚马逊EC2中有没有同等的服务可以做同样的事情?
不,不是真的。有亚马逊云搜索,但它基本上运行在相同的原则上,并要求您上传要搜索的数据。因此,除非有人已经将数据上传到亚马逊云搜索帐户,否则,如果不上传数据,就没有办法做到这一点。
https://stackoverflow.com/questions/14325959
复制相似问题