Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理

  • オライリージャパン
3.75
  • (1)
  • (4)
  • (3)
  • (0)
  • (0)
本棚登録 : 140
感想 : 3
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (210ページ)
  • / ISBN・EAN: 9784873115122

作品紹介・あらすじ

自然言語処理、情報抽出、機械学習などに共通する、テキスト処理のアルゴリズムに重点を置きながら、MapReduceのアルゴリズム設計について解説。MapReduceのデザインパターンの概念を説明し、様々な領域に共通して現れる問題に対して、再利用可能かつ汎用的な対処方法を紹介した。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 良本。MapReduceプログラム開発の定番の説明(注:パターンカタログでない)。象本の次としてお勧め。最終章は本文(訳文?)が難解すぎ。EM,HMMを知ってても理解し難い。

  • 4章以降は内容が難しく斜め読み…。
    データローカリティを活かすin mapper conbiningは使えそう。
    1章、2章の基礎的な内容と3章を読むだけでも良いと思う。

  • フォトリーディングNo.7

    目的:Hadoopとは何なのか知る

    トリガーワード:クラウド、アルゴリズム、分散ファイルシステム、クラスタ、ソート、mapper、キー、クローラ、インデックス、reducer、トレーニング、ネームノード、データノード、スケーラビリティ、ペア

    質問:①Hadoopとは何なのか?②Googleでどのように使われているのか?

    ~20120426ポストレビューここまで~
    ~20120427アクティベーションここから~

    質問に対するまとめ:
    ①分散アーキテクチャ。OSS。サーバ群によるクラスタ環境で実行。DBではない。IFは制限→その一つが「MapReduce」
    ②検索エンジンのアルゴリズムにMapReduce採用。元々Googleによって開発。

    雑感:難しく、全体的にほとんど読めない。数学・統計も抑えてないと厳し目。
    そもそも「Hadoop」というより「MapReduce」の本なので、今回の目的に即した本では無さそう(?) オライリーの「Hadoop」もしくは入門本から入る必要有。

全3件中 1 - 3件を表示

Jimmy Linの作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×