GraphX
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/11/24 07:50 UTC 版)
「Apache Spark」の記事における「GraphX」の解説
Apache Spark上の分散グラフ処理フレームワークを示す。不変のRDDに基づきグラフは不変であるため、グラフデータベースのようなトランザクション方式ではなく更新が必要なグラフには適していない。大規模並列アルゴリズム(ページランクなど)を実装するための2つの別個のAPI、Pregel抽象化、より一般的なMapReduceスタイルAPIを提供している。Spark1.6で旧式に廃止された旧型のBagelとは異なり、GraphXはプロパティグラフ(プロパティがエッジや頂点に付加できるグラフ)を完全にサポートしている。 HadoopディスクベースのMapReduceを利用したApache GiraphのSparkインメモリ版として見ることができる。 Apache Sparkと同様にUC BerkeleyのAMPLabとDatabricksで研究プロジェクトとして開始され、後にApacheソフトウェア財団とSparkプロジェクトに寄贈された。
※この「GraphX」の解説は、「Apache Spark」の解説の一部です。
「GraphX」を含む「Apache Spark」の記事については、「Apache Spark」の概要を参照ください。
- GraphXのページへのリンク