Gremlin -- 常用查询用法

目录

  • 一:gremlin查询过程
  • 二:常用的查询方法
  • 三:java中如何使用呢?
    • 1:创建源节点
    • 2:组装语句

一:gremlin查询过程

gremlin的查询是流式查询,一步一步的进行下去,当然这里的“一步”可能是一个方法(g.V().has())也可能是多个方法组成的一步(g.V().order().by(desc,‘age’))。下面看一个案例

g.V().has('code','AUS').out().value('name','age').order().by('age',desc)

步骤解读 第一步:g.V() 标明是对图库中的所有节点进行操作的 第二步:has(‘code’,‘AUS’) 获取包含属性code并且该属性的值为AUS的所有节点 第三步:out() 获取上个结果集中所有节点的出边对应的节点 第四步:value(‘name’,‘age’) 获取上个结果集中所有节点的name和age属性值 第五步:order().by(‘age’,desc) 对结果集根据age进行降序排序 从上面便可以看出gremlin流式执行的特征,这使得gremlin的查询语句可以十分的灵活,从而满足我们的各种查询需求。

1:想要了解更多全面的查询方法,可以看英文官网:http://kelvinlawrence.net/book/Gremlin-Graph-Guide.html#_introduction 2:通过看本文章你会对gremlin查询的形式方法有大体的了解,之后找方法在官网就可以了 3:本文章在使用过程会不断更新

二:常用的查询方法

  1. 首先,这里的g.V()中的g为遍历实例,其创建为:
graph = TinkerGraph.open()
g = graph.traversal() 
  1. V()与E()

在下面的例子中,你会发现几乎每一个查询的开始都会有他们的存在 V()代表查看图中的所有节点,接下来的操作是对节点进行操作的 E()代表图中的所有边,接下来的操作就是对边操作的

  1. 使用value获取节点的某一属性值
g.V().has('code','AUS').out().value('name','age')
//获取AUS的出边对应节点的name和age属性的值
g.V().has('code','AUS').out().value()
//显示所有的属性值
  1. 使用has、hasNot获取(不)包含某一属性值得节点
g.V().has('code','AUS')
//获取拥有code属性并且其属性值为AUS的节点
g.V().has('user','code','AUS')
//相当于 g.V().hasLabel('user').has('code','AUS')
g.V().hasNot('name')
//获取所有不包含name属性的节点,等同于g.V().not(has('name'))
  1. 使用hasLabel获取label为某值得节点
g.V().hasLabel("user")
//获取label为user的节点
  1. 使用hasNext方法判断两个节点中是否有查询的边
  • 返回值为boolean类型参数,存在则返回true,不存在则false
g.V().has('code','AUS').out('route').has('code','DFW').hasNext()

true

g.V().has('code','AUS').out('route').has('code','SYD').hasNext()

false
  1. 使用range()获取某一范围内的数据
g.V().hasLabel('airport').range(0,2)
//输出结果集中1,2个节点
g.V().hasLabel('airport').range(3,6)
//输出结果集中4,5,6个节点
g.V().range(3500,-1)
//输出结果集中3500往后的所有节点
  1. 使用skip跳跃节点查找
g.V().has('region','US-TX').skip(5)
//跳过节点集中的前5条数据,从第六条开始,效果等同于下面的语句
g.V().has('region','US-TX').range(5,-1)
  1. 使用order对结果集进行排序
g.V().has('code','AUS').out().order().by()
g.V().has('code','AUS').out().order(local).
g.V().has('code','AUS').out()
g.V().has('code','AUS').out()

order(local)中local的作用:Notice also how local is used as a parameter to order. This is required so that the ordering is done while the final list is being constructed. If you do not specify local then order will have no effect as it will be applied to the entire result which is treated as a single entity at that point. 这是官网上的一句话,我翻译了一下没太明白,大体的意思我理解的是:加local参数的话会在最终结果生成前就完成排序。。大家可以翻译一下

  1. 使用out,in进行查找结点的出边和入边所对应的节点
g.V().has('code','AUS').out()
//获取AUS的节点所有出边对应的节点
g.V().has('code','AUS').out("brought")
//获取AUS节点所有边关系为“brought”的出边对应的节点
g.V().has('code','AUS').in()
//获取AUS的节点所有入边对应的节点
g.V().has('code','AUS').in("brought")
//获取AUS节点所有边关系为“brought”的入边对应的节点
  1. 使用count、groupCount对结果集计数
g.V().has('code','AUS').out().count()
//获取AUS节点的出边的个数
g.V().has('code','AUS').out().groupCount().by("name")
//根据结果集的name属性的值进行分组计数,最终结果类似于:[a:1,b:3,r:6]
  1. 使用dedup进行去重
g.V().has('code','AUS').out().out().dedup().count()
//步骤解读:
1:获取AUS节点的两度出节点,用dedup对结果进行去重
2:使用count()对结果集进行计数
  1. 使用aggregate创建一个临时集合
//获取AUS节点的大于两度出度的节点个数,注意应该不包含一度的节点
g.V().has('code','AUS').out().aggregate('nonstop').
     out().where(without('nonstop')).dedup().count()
//第一行获取一度的节点并将其结果集存储为一个临时集合命名为"nonstop"
//第二行获取二度节点,并且使用临时集合去除掉一度节点,去重,计数
  1. 使用limit、tail、timeLimit限制结果数量
g.V().hasLabel('airport').values('code').limit(20)
//只显示前20个
g.V().hasLabel('airport').values('code').tail(20)
//只显示最后20个
g.V().has('airport','code','AUS').
      repeat(timeLimit(10).out()).until(has('code','LHR')).path().by('code')
//上述作用:获取在10毫秒内查询到的结果
  1. 使用outE\inE outV\inV指定方向的边
  • 平常用法:
g.V().has('code','AUS').outE().inV().path()
g.V().has('code','AUS').inE().outV().path()
//获取出边或者入边
g.V().has('code','AUS').outE('brought').inV().path()
g.V().has('code','AUS').inE('brought').outV().path()
//获取指定的边关系的出边入边
  • 获取两个节点之间的边
g.V().has('code','MIA').
    outE().as('e').inV().has('code','DFW').
    select('e')
//第一步:选择源节点
//第二步:outE找到所有出边as('e')将结果存储为标签e
//第三步:inV().has('code','DFW')找到前面结果集的边入节点为code属性为DFW值得节点
//将边显示出来:结果类似于:
e[4127][16-route->8]
这样就获取到了两个节点之间的边
  1. 使用as,select和project来引用遍历步骤
  • as可以将前一个步骤结果集临时存储下来,便于下面使用
g.V().has('code','DFW').as('from').out().
      has('region','US-CA').as('to').
      select('from','to')
//has('code','DFW').as('from')   :将has('code','DFW')的结果集标识为from标签的临时结果,下面使用的时候直接使用from即可
//返回的结果类型
[from:v[8],to:v[13]]
[from:v[8],to:v[23]]
[from:v[8],to:v[24]]

g.V().has('type','airport').limit(10).as('a','b','c').
      select('a','b','c').
        by('code').by('region').by(out().count())
//返回结果为:
[a:ATL,b:US-GA,c:232]
[a:ANC,b:US-AK,c:39]
[a:AUS,b:US-TX,c:59]
  • project()相当于select和by共同使用的效果
g.V().has('type','airport').limit(10).
      project('a','b','c').
        by('code').by('region').by(out().count())
//效果等同于:只不过上面的写法更加简洁
g.V().has('type','airport').limit(10).as('a','b','c').
      select('a','b','c').
        by('code').by('region').by(out().count())
//输出结果:
[a:ATL,b:US-GA,c:232]
[a:ANC,b:US-AK,c:39]
[a:AUS,b:US-TX,c:59]
  1. 相同标签的处理方式,在select中使用first,last,all参数
g.V(1).as('a').V(2).as('a').select(first,'a')
v[1]
//选择第一个a标签
g.V(1).as('a').V(2).as('a').select(last,'a')
v[2]
//选择最后一个a标签
g.V(1).as('a').V(2).as('a').select(all,'a')
[v[1],v[2]]
//选择所有a标签
g.V().has('code','AUS').as('a').
      out().as('a').limit(10).
      select(last,'a').by('code')

g.V().has('code','AUS').as('a').
      out().as('a').limit(10).
      select(first,'a').by('code')

g.V().has('code','AUS').as('a').
      out().as('a').limit(10).
      select(all,'a').unfold().values('code')
  1. 使用valueMap获取节点或者边的属性

返回结构:kv对数组,key:属性key,v:属性的值列表(list,这样可以显示该属性对应的多个值)

结构类似于:

[country:[US], code:[AUS], longest:[12248], city:[Austin], elev:[542], icao:[KAUS], lon:[-97.6698989868164], type:[airport], region:[US-TX], runways:[2], lat:[30.1944999694824], desc:[Austin Bergstrom International Airport]]

g.V().has('name','gremlin').valueMap()
//获得节点的所有属性
//valueMap在默认情况下不显示ID和label值,必须添加true参数
g.V().has('name','gremlin').valueMap(true)
//返回的集合中包含ID和label值
g.V().has('code','AUS').valueMap(true,'region')
//返回id+label+region三个属性的kv
g.E(5161).valueMap(true)
//返回id为5161边的属性

为了完整起见,还可以使用select来优化valueMap的结果

g.V().has('code','AUS').valueMap().select('code','icao','desc')
//返回的结果为 code+icao+desc属性的kv

如果想要结果集合更容易展现,可以使用unfold方法将其展开,但是结果的结构就变了,只是为了在 console上更加容易看

g.V().has('code','AUS').valueMap(true,'code','icao','desc','city').unfold()
//输出结果形式:
code=[AUS]
city=[Austin]
icao=[KAUS]
id=3
label=airport
desc=[Austin Bergstrom International Airport]
  1. 使用toList,toSet,bulkSet和fill创建集合
  • toList()创建结果集合为list集合,可重复,不排序,要想排序可以使用order方法
listr = g.V().has('airport','region','US-TX').
              values('runways').toList().join(',')
//此处的join(',')是将结果组合起来,用逗号分割,这样最终的结果就是一个字符串
//输出结果:
2,7,5,3,4,3,3,3,3,4,2,3,2,3,2,2,3,2,1,3,2,3,4,3,4,2

//在我们项目中使用一般不会加join,因为最终结果只会是一个字符串
listr = g.V().has('airport','region','US-TX').
        values('runways').toList()
//使用集合的一些操作:
-> listr[1]
7

-> listr.size()
26

-> listr[1,3]
7
3
  • toSet()创建结果集合为Set集合,不可重复
setr = g.V().has('airport','region','US-TX').
             values('runways').toSet().join(',')
//输出结果:
1,2,3,4,5,7
  • toBulkSet()将结果集相同数据放在连续的位置,其余与tolist相同
setb= g.V().has('airport','region','US-TX')
    .values('runways').toBulkSet().join(',')
//输出结果:
2,2,2,2,2,2,2,2,7,5,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,1

//不使用join
setb= g.V().has('airport','region','US-TX').values('runways').toBulkSet()
//一些操作
setb.uniqueSize()   
6

setb.size()
26

setb.asBulk()
2=8
7=1
5=1
3=11
4=4
1=1
  • fill方法将结果集填充入进一个自定义集合中
//案例一:
a = []
g.V().has('airport','region','US-TX').values('runways').fill(a)
//操作
a.size()
26

a[1,3]
73
//案例二:
s = [] as Setg.V().has('airport','region','US-TX').values('runways').fill(s)
//操作
println s
[2, 7, 5, 3, 4, 1]

未完待续。。。。

三:java中如何使用呢?

1:创建源节点

private GraphTraversal createGraphTraversalByIdLabel(String id,String label,Map<String,Object> propertys){
    GraphTraversal graphTraversal = null;
    if(StringUtils.isNotEmpty(id)){
        graphTraversal = getGraphTraversalSource().V(id);
    }else{
        graphTraversal = getGraphTraversalSource().V();
    }
    if(StringUtils.isNotEmpty(label)){
        graphTraversal = graphTraversal.hasLabel(label);
    }
    if(propertys!=null&&propertys.size()>0){
        for (Object o : propertys.entrySet()) {
            Map.Entry entry = (Map.Entry) o;
            String key = entry.getKey().toString().trim();
            String value = entry.getValue().toString().trim();
            if(StringUtils.isNotEmpty(key) &&
                    StringUtils.isNotEmpty(value))
                graphTraversal = graphTraversal.has(key, value);
        }
    }
    return graphTraversal;
}

2:组装语句

@Override
public GraphTraversal timeLineGraphPath(String id, String label,
                                        Map<String, Object> propertys,
                                        String[] edgeLabels, String type,
                                        String beginTime, String endTime) {
    GraphTraversal graphTraversal = createGraphTraversalByIdLabel(id,label,propertys);
    if(edgeLabels==null||edgeLabels.length==0)
        return graphTraversal.valueMap(true);
    else
        return                 graphTraversal.outE(edgeLabels).and(__.has(type,P.gte(beginTime)),__.has(type,P.lte(endTime))).outV().path().order().by(type);
}

其中的”_.“是填充字符,只是为了可以使用方法,比如and( _.has(type,P.gte(beginTime)。。中如果没有__.的话,不能这写吧,也不支持呀and(.has()。。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Debian社区

DDR5 内存来了:7nm 工艺、4400MHz 频率

DDR4 内存目前还是绝对主流,不断被深入挖潜,频率已经突破 5GHz,不过下一代 DDR5 也已经蠢蠢欲动了。Cadence 公司今天就宣布了 DDR5 的全...

14320
来自专栏Spark学习技巧

海量数据处理之BloomFilter

一提到元素查找,我们会很自然的想到HashMap。通过将哈希函数作用于key上,我们得到了哈希值,基于哈希值我们可以去表里的相应位置获取对应的数据。除了存在哈希...

21130
来自专栏Debian社区

处理器CPU散装和盒装有什么区别

很多人在装机过程发现,在某电商平台输入处理器信息后,会出现盒装版和标明散片装两种商品,二者在售价上也天差地别,因为担心假货,很多人愿意花费更多的售价购买正品盒装...

12830
来自专栏Debian社区

Raspberry Pi (树莓派) 3代A+版发布

近日Raspberry Pi(树莓派)基金会宣布发布树莓派3代A+版(Raspberry Pi 3 MODEL A+)。尺寸是标准的树莓派A+尺寸,继承了3代的...

12030
来自专栏Coding迪斯尼

使用java自造TCP/IP协议栈:使用JPCAP实现数据发包

从本节开始,我们打算使用java把tcp/ip网络协议栈重新实现一遍。这是一个不小的野心,自然也是一个不小的工程,好在前面顺利完成了操作系统,编译器两门课程的实...

45840
来自专栏Debian社区

AMD Zen之父跳槽Intel:推进10nm工艺

Jim Keller堪称微处理器行业的传奇人物,多年来转战AMD、苹果、特斯拉,设计了众多优秀的CPU架构,尤其是K7/K8、Zen架构两度帮助AMD崛起,苹果...

14830
来自专栏吾真本

斯诺登教授(Dave Snowden)帮助企业进行决策的“栖息地”(Cynefin)框架 v0.1

译自斯诺登教授(Dave Snowden)2018年11月30日在领域驱动设计中国峰会2018的“栖息地”(Cynefin)框架培训材料。

29210
来自专栏云计算D1net

云计算,边缘计算和雾计算:了解每个计算的实际应用

您的运营是建立在您自己的一般云基础设施,还是选择使用雾和边缘计算等更专业的工具,这些都取决于您的业务需求和抱负。

19030
来自专栏数据科学

python流数据动态可视化

“流数据”是连续生成的数据,通常由某些外部源(如远程网站,测量设备或模拟器)生成。这种数据在金融时间序列,Web服务器日志,科学应用程序和许多其他情况下很常见。...

95230
来自专栏数据派THU

送你一份使用k近邻算法实现回归的实用指南(附代码、链接)

在我遇到的所有机器学习算法中,KNN是最容易学会的。尽管它很简单,但事实证明它在某些任务中非常有效(我们将在本文中看到)。

11420

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励