spark-graphx 相关问题

GraphX是Apache Spark中用于图形和图形并行计算的组件

Graphframes:spark graphframes 中两个顶点列表之间的 BFS

我的目标是找出两个顶点之间的最大路径长度是否为<= 4. I have a graph dataframe and a test file of the below format. I am trying to get the output column(OP) from bfs fun...

回答 1 投票 0

pyspark中的哪个库实现了graphx api

pyspark 中的库是什么,我可以使用它来实现与 Spark.graphx.GraphLoader 类似的功能。基本上我打算将以下 scala 代码导入到 pyspark 代码中。 ''' 导入 org.apache.spark.

回答 1 投票 0

将包含嵌入列表的 Spark DataFrame 转换为 Scala 中的 RDD

我有一个以下格式的DataFrame: 特点 标题 托尼·斯塔克 [“钢铁侠”] 詹姆斯·布坎南·巴恩斯 【《美国队长:复仇者先锋》、《美国队长:胜利……

回答 1 投票 0

将 GraphX 用于组中的多个子逻辑

我正在处理一个要求,我正在尝试使用 GraphX 这是输入数据集 组,childid,parentid A,100,根 A,200,100 A,300,200 A,400,300 A,500,400 B,100,root //在B组中,我们可以看到

回答 0 投票 0

如何在 GraphX 中保存图形

我正在尝试在 GraphX 中使用来自 OpenStreetMap 的数据构建道路网络图。这是通过创建数据帧来完成的,最后通过创建 RDD 来完成。然后我运行最短路径算法...

回答 0 投票 0

火花图上的克里姆林宫遍历查询

我使用Apache Spark Graphx框架从s3构建了一个属性图(6000万个节点,4000万个边)。我想在该图上触发遍历查询。我的查询将像:-g.V()。has(“ ...

回答 1 投票 0

如何通过两步连接在GraphX中计算度数

我有一个有向图说,例如fromNode-> toNode。我想计算“ toNode”上的总传入连接,包括1跳或2跳连接。例如:从...

回答 1 投票 1

更改输入参数与在火花图的Vprog中创建新对象之间有什么区别

有我的程序:静态类Vprog扩展AbstractFunction3 实现可序列化{@Override public OddRange apply(Object l,...

回答 1 投票 0

更改输入参数与在Spark graphx的Vprog中创建新对象之间有什么区别

有我的程序:静态类Vprog扩展AbstractFunction3 实现可序列化{@Override public OddRange apply(Object l,...

回答 1 投票 0

标量中的一跳和两跳引用

我有一个“从节点”和“到节点”的列表,看起来像这样:1234 4567 1234 6789 1234 3456 4567 9876…。关键是要找出哪个节点最重要,哪个...

回答 1 投票 0

如何理解Apache GraphX的pregel实现中的maxIterations

官方解释是maxIterations将用于非收敛算法。我的问题是:如果我不知道算法的收敛性,应该如何设置maxIterations的值? ...

回答 1 投票 1

为什么我的Spark类型不匹配?

我已经从互联网上下载了标签传播算法的源代码。来源如下:def run [VD,ED:ClassTag](graph:Graph [VD,ED],maxSteps:Int):Graph [VertexId,ED] = {val ...

回答 1 投票 1

为什么我无法使用Spark中的map函数更改节点的属性?

我正在Spark中使用GraphX来处理图形。我有一个val common_neighbors:RDD [VertexId],其中包含一些vertexId。我使用map函数将其转换为诸如(node,1)的结构,其中...

回答 1 投票 0

比较两个节点之间的广播变量和Spark GraphX中使用RDD.filter的交集

i在GraphX中处理图形。通过使用以下代码,我制作了一个变量来存储RDD中节点的邻居:val all_neighbors:VertexRDD [Array [VertexId]] = graph.collectNeighborIds(EdgeDirection ....

回答 1 投票 1

如何在Spark GraphX中正确使用Broadcast变量?

我使用GraphX处理图形。我使用了GraphLoader进行加载,并使用以下代码制作了一个包含每个节点的邻居的变量:val all_neighbors:VertexRDD [Array [VertexId] ...

回答 1 投票 0

如何在Spark中过滤RDD之后如何获取键的第一个值?

我是新手。我已经使用GraphLoader来制作我的图形,并且我使用mapVertices和下面的代码来更改nodes属性:case class nodes_property(label:Int,get_label:Boolean)并在某些情况下...

回答 1 投票 0

如何将图形作为参数传递给Scala中的方法

我是Scala的新手,我想创建一个用于管理图形任务的类。所以我想将Graph对象传递给我的类作为参数。例如:val graph = Graph(users,edges,nowhere)users:...

回答 1 投票 0

GraphX的基于内存的随机播放和Spark Core的随机播放有什么区别

[从论文“ GraphX:分布式数据流框架中的图形处理”(Gonzalez等,2014)中,我了解到GraphX修改了Spark随机播放:基于内存的随机播放:Spark的默认随机播放...

回答 1 投票 0

如何使用pyspark graphframe pregel API实现周期检测

我正在尝试使用Pyspark和来自graphframe的预凝胶包装器来实现Rocha&Thatte(http://cdsid.org.br/sbpo2015/wp-content/uploads/2015/08/142825.pdf)中的算法。我在这里...

回答 1 投票 2

在graphX中,如何使用自定义PartitionStrategy对其拓扑进行分区?

我想使用图拓扑信息添加一个新的PartitionStrategy。不过,我发现PartitionStrategy仅具有以下功能。我找不到任何可以接收图形的函数...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.