我想测试Virtuoso在处理分布式查询方面有多好。
例如,我有一个大型的RDF图(超过100 to ),我想使用集群来查询这个图。
Virtuoso可以在小图上拆分图形用于集群,还是应该将图形拆分并手工聚集查询结果?换句话说,是否可以使用Virtuoso进行分布式查询?如果可能的话,我在哪里可以找到这方面的指南?
提前谢谢。
发布于 2013-11-11 13:57:31
几天前,有人在OpenLink支持论坛上问了一个不祥的类似问题,你是同一个人吗?
为什么要分割这个大的RDF图(超过100 of ),这在三倍上等于多少?
有一个商业形式的虚拟集群版,仅允许跨多个物理实例和/或机器的多个Virtuoso实例在那里汇集资源,用于处理大量数据、RDF或其他is等。这样,您就不必物理拆分图,只需将数据加载到集群实例中,它就会自动为您进行分区,并且您将自动查询,就像单个Virtuos实例一样,具有良好的本地性,这是性能的关键。
Virtuoso还支持用于分布式查询执行的标准斯派克语法,详细介绍在W3C网站上,使用"service“子句执行远程执行,并通过本地Virtuoso实例返回结果。因此,针对本地Virtuoso实例的DBpedia SPARQL端点执行远程查询的示例查询如下:
选择*其中{ SERVICE http://dbpedia.org/sparql { 选择*其中 { 是的。过滤器(?s = http://dbpedia.org/resource/Nevis )}限制100 } }
因此,数据可以被分割到多个单一服务器实例(开放源码或商业或其他与SPARQL提供支持的服务器实例)和查询,但是您必须手动拆分该图,而sparql-fed的性能通常不是很好,因为您的松散局部性和“真正的”集群服务器解决方案的内部优化.
https://stackoverflow.com/questions/19837402
复制相似问题