我正在尝试编写一个Gremlin查询,它将遍历几个顶点并返回叶子以及有关它到达那里的路径的一些信息。
用一个例子来解释是最容易的:
# Sample graph diagram
# 1 --> 2* --> 3* --> 4
# \ \---> 5* --> 6
# \-> 7
# Create sample graph
g.addV('V').as('1').property('id','1').property('notable',false)
.addV('V').as('2').property('id','2').property('notable',true)
.addE('E').from('1')
.addV('V').as('3').property('id','3').property('notable',true)
.addE('E').from('2')
.addV('V').as('4').property('id','4').property('notable',false)
.addE('E').from('3')
.addV('V').as('5').property('id','5').property('notable',true)
.addE('E').from('2')
.addV('V').as('6').property('id','6').property('notable',false)
.addE('E').from('5')
.addV('V').as('7').property('id','7').property('notable',false)
.addE('E').from('1')
以下遍历从顶点1开始并尽可能地继续out()
,使用as()
收集“值得注意的”顶点。
g.V('1')
.out()
.until(out().count().is(0))
.repeat(
optional(has('notable', true).as("notables"))
.out()
)
.project('Id','NotableAncestors')
.by(id())
.by(coalesce(
select('notables').unfold().id(), inject([])
))
我想看到的是每个叶子的ID,其中包含一系列“着名”祖先的ID:
[
{
"Id": "7",
"NotableAncestors": []
},
{
"Id": "4",
"NotableAncestors": ["2", "3"]
},
{
"Id": "6",
"NotableAncestors": ["2", "5"]
}
]
但是,而不是NotableAncestors
是一个数组,我只得到第一个值,因为unfold()
将数组展平为其中的第一个项目,如下所示。或者,如果我遗漏unfold()
,我得到一个数组,但它总是空的。
[
{
"Id": "7",
"NotableAncestors": []
},
{
"Id": "4",
"NotableAncestors": "2"
},
{
"Id": "6",
"NotableAncestors": "2"
}
]
我想你可以简化一下。首先请注意,as()
是一个步骤标签,您可以参考该标签来检查遍历中某个步骤中的遍历器是什么,因此它并不是真正“收集”事物。这是另一种方法:
gremlin> g.V('1').
......1> repeat(out()).
......2> emit(outE().count().is(0)).
......3> project('Id','NotableAncestors').
......4> by(id()).
......5> by(path().unfold().has('notable',true).id().fold())
==>[Id:7,NotableAncestors:[]]
==>[Id:4,NotableAncestors:[2,3]]
==>[Id:6,NotableAncestors:[2,5]]
我删除了一堆额外的步骤,只是从顶点“1”反复遍历out()
,只发出你关心的叶子顶点。然后,我只是分析path()
,以获取任何“值得注意的”顶点的叶子,并添加折叠到List
为“NotableAncestors”。