我正在创建一个爵士乐知识库,现在正在将爵士音乐家联系在一起。我想在音乐家之间建立一种叫做:PLAYED_WITH的关系,如果他们曾经在同一张唱片发行版上工作过。
我尝试使用以下代码来完成此操作:
MATCH (a:Artist), (other:Artist)
WHERE
a.genre = 'jazz' AND
EXISTS((a)-[:INSTRUMENT]->(:Release)<-[:INSTRUMENT]-(other))
CREATE (a)-[r:PLAYED_WITH]->(other)
RETURN count(r)
该查询运行,但它已经执行了几个小时,使我相信它已经运行到一个无限循环。顺便说一下,我的数据库里有大约5500名爵士音乐家。
发布于 2019-08-05 19:49:00
这不是一个无限循环,但是这里确实有一个笛卡儿积,您的第一次匹配将导致至少5500 x 5500 = 30,250,000对需要评估(可能更多,因为other
不限于爵士乐音乐家),所以需要检查很多对之间的路径。
首先,您需要确保您有一个关于艺术家(流派)的索引,因此您对a
的初始查找相对较快。
接下来,将a
和other
之间所需的模式移到匹配中,因此我们只需遍历就可以找到曾经一起演奏过的音乐家,并避免笛卡尔产品。
这也可能有助于获得不同的配对,因为这很可能是如果两个音乐家一起演奏,他们一起演奏了好几次,所以我们只想处理每一个不同的一对。
所以看看这对你有用吗:
MATCH (a:Artist)-[:INSTRUMENT]->(:Release)<-[:INSTRUMENT]-(other:Artist)
WHERE a.genre = 'jazz'
WITH DISTINCT a, other
MERGE (a)-[r:PLAYED_WITH]-(other)
RETURN count(DISTINCT r)
https://stackoverflow.com/questions/57364504
复制相似问题