首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Recommending items to more than a billion people(面向十亿级用户的推荐系统)

我们以前已经介绍过Apache Giraph,这是一个用于分布式迭代和图形处理的强大平台,以及我们为使其符合我们的需求所做的工作。我们还写了关于图分区的应用程序。...Giraph在海量数据集上工作得非常好,易于扩展,而且我们在开发高性能应用程序方面有很多经验。因此,Giraph是我们解决这一问题的首选。 2....我们最终提出了一种方法,它要求我们使用 worker-to-worker 的消息传递来扩展Giraph框架。...注意,我们在Giraph之上也有k-means集群实现,将这一步合并到计算中非常容易。 7....在运行矩阵分解算法之后,我们还有一个Giraph工作,即为所有user计算TOP推荐。

63610

Facebook 推荐算法

我们已经写过Apache Giraph,一个用于分布式迭代和图形处理的强大平台,以及我们为满足我们的需求所做的工作。我们还编写了一个用于图形分区的开发应用程序。...Giraph在大量数据集上运行良好,易于扩展,我们在开发高性能应用程序方面拥有丰富的经验。因此,Giraph是我们解决这个问题的明智选择。...标准方法和问题 为了以分布式方式有效地解决上述公式,我们首先研究了与Giraph设计相似的系统如何做到(使用消息传递而不是map / reduce)。...在下图中,我们将我们的旋转混合方法(我们在Giraph中实现)与标准方法(在Spark MLlib中实现,包括一些额外的优化,例如最多向机器发送一次特征向量),相同的数据进行了比较组。...运行矩阵分解算法后,我们有另一个Giraph工作,实际计算所有用户的最佳建议。

1.2K30

Graph Mining:审视世界的眼睛

OLAP应用框架基本上都是基于Google三驾马车之一Pregel[18]的实现,就主要Giraph[19],PowerGraph[20],GraphX[21]这几个选择。...Apache Giraph是2012年开始的,该项目由于底层并行框架是基于Apache Hadoop的MapReduce框架来实现的,在Spark流行之后也不如GraphX有活力了。...Facebook一直是Giraph的拥趸,其研究团队在2016年发布了一份报告[22],比较了Giraph和GraphX在他们的应用场景下的性能,总的来说,GraphX 不足以支持他们图处理负载的扩展性和性能需要...PowerGraph之前还存活的时候用过,得益于底层实现机制,比Giraph和GraphX快得不是一星半点。 ? 图 3.3 GraphLab和Spark的分布式性能比较[23] ?...id=1807184 [19].https://github.com/apache/giraph [20].https://www.usenix.org/node/170825 [21].https:/

1.7K10

Hadoop专业解决方案-第13章 Hadoop的发展趋势

图形化处理系统,如Pregel和Giraph基于并行处理模型称作BulkSynchronous Parallel散装同步并行 (BSP),能够同步图形处理节点之间的通信。...在Giraph上,您提交一个MapReduce任务,但其在内部处理迭代步骤使用Vertex的环境,保存状态图在内存中并不联动MapReduce任务。...Giraph利用了Hadoop和MapReduce的数据存储的基础资源管理,但与在MapReduce中使用BSP不同的是,Giraph还引入了ZooKeeper进行容错以及集中的调度服务         ...Hama也是Apache的一个项目,类似于Giraph,是一个BSP的计算框架,该框架应用于HDFS的顶层。...因为Apache 的Giraph(本章前面讨论过)是Google的高性能图形化分析平台(Pregel)的开源实现,并且Facebook应用Griaph的图形分析于其社交网络上,毫无疑问这将是Hadoop

63230
领券