入門 PySpark PythonとJupyterで活用するSpark2エコシステム
- オライリー・ジャパン (2017年11月22日発売)


本ページはアフィリエイトプログラムによる収益を得ています
- Amazon.co.jp ・本 (320ページ)
- / ISBN・EAN: 9784873118185
作品紹介・あらすじ
Apache SparkをPythonから使うための方法とノウハウを網羅!
PySparkとはSparkを実行するためのPython APIです。インメモリ(ソフトウェアを実行する際、使用するプログラムやデータのすべてをメモリ上に読み込み、ハードディスクなどの外部記憶装置を使わないこと)で高速に分散処理ができるフレームワークで、MLlibという機械学習ライブラリが利用できることなどから注目されています。本書は、Apache SparkをPythonから使うための方法とノウハウを書いた書籍です。
感想・レビュー・書評
-
sparkはどんなもんかいなと思って手にとってみた。
事前に思ってたより簡単に試せそうな印象。
hadoopに比べて10倍~100倍ははやい、というのを繰り返し書いてあったけどそうなのだろうか。
たしかにhadoopは遅い印象が強いが、、。詳細をみるコメント0件をすべて表示 -
請求記号 007.6/D 91
全2件中 1 - 2件を表示