検索エンジンはなぜ見つけるのか 知っておきたいウェブ情報検索の基礎知識

Kindle版

β運用中です。
もし違うアイテムのリンクの場合はヘルプセンターへお問い合わせください

  • 日経BPマーケティング (2011年3月14日発売)
3.13
  • (6)
  • (18)
  • (28)
  • (15)
  • (3)
本棚登録 : 338
感想 : 36
サイトに貼り付ける

本ページはアフィリエイトプログラムによる収益を得ています

Amazon.co.jp ・本 (238ページ) / ISBN・EAN: 9784822284619

AIがまとめたこの本の要点

プレミアム

みんなの感想まとめ

検索エンジンの仕組みや歴史を解説した本は、初学者にとって非常に読みやすく、特に図書館の情報検索の基盤がどのようにデジタル世界に応用されているかを知ることができる点が魅力です。情報処理試験の対策としても...

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • このシリーズは、非常に読みやすく、初学者に最適なシリーズです。

    で、今回手にしたのは、「検索エンジンはなぜ見つかるのか」という問いの書かれた本です。

    まずは歴史から。
    検索する際の基になったのは図書館です。
    本を探す、どういった本、だれが書いたものなど、様々な属性の本を
    的確に早く見つけるということがこの検索エンジンでも基盤になっているとのことです。
    この歴史のくだりが非常に読みものとして面白いですね。

    検索の仕方については情報処理試験対応として勉強するにも非常にわかりやすい。おそらく、問題集や対策本を読むより、ここだけについては読んで損はしないはず、文系の僕にとっては一番わかりやすい例だったかもと思いました。

    ただ、もっとより詳細については、別の本を読んで理解を深める必要があります。あくまで、入門書といった棲み分けなんでしょうね。

    このシリーズの中でも読みやすさだけはピカイチで、本シリーズの他の本よりも敷居ははるかに低い気がします。

  • 2011/4/16 予約 6/7 借りる。 6/13 読み始める 6/24 読み終わる

    いまや検索無しでは生きられない!!
    求める答えが 瞬時に返ってくる検索の仕組みが、平易な解説ながら しっかりした内容で解説される。
    検索を妨げる「裏切り戦略」、人間のさが火もしれませんね。
    将来は、「何を探しているのかわからない人間」に、検索エンジンが 「探すべきもの」を教えるようになるのか?

    内容と著者は
    内容 :
    膨大な数のウェブページの中から、一瞬の間に的確な答えを導き出す検索エンジンのしくみを、
    平易な文章と適切な比喩、そして古代から近代にかけての情報収集の歴史と対比させることでわかりやすく解説する。

    著者 :
    プログラマ。有限会社未来検索ブラジル所属。

  • 【由来】


    【期待したもの】


    【要約】


    【ノート】

  • YahooやGoogleなどの検索エンジンの仕組みの基礎の基礎かな。もう少し具体的なシステムとの関連も知りたいものだ。

  • ちょっとピンとこない本だった。

  • -

  • 検索に関する基本的な仕組み・技術が広く知ることができる点がいい。

    <覚えておきたいアルゴリズムや用語>
    Boyer Moore法
    二分探索法
    Trie Memory
    Double-Array TRIE
    γ符号、δ符号、Golomb符号
    Ziftの法則、Heapの法則
    転置索引
    Burrows Wheeler Transform
    ベクトル空間モデル
    ページランク

  • ある程度知っている内容が多かった。
    コラムの方がためになった気が…

  • 検索エンジンというよりは図書館がいかに大量の本を整理し見つけ出すかの説明が多かった。ただ、検索エンジンの原則はそれに似ているってことが理解できた。

  • 数式やコンピュータ用語が排除された方が分かりやすい、と感じる人向けの本です。
    3章の「索引」「圧縮」の記述は確かに分かりやすくて良かったと思います。

  • 元々検索エンジンに対して興味を持っていたので、この本は非常に読みやすくためになりました!!
    私のような初学者向けにとてもいいと思います。ですが、わからない単語が多く、それを調べることに時間がかかったり、アルゴリズムの部分が少し理解しにくかったので、、星4にしました。

  • 「わからない人にもわかりやすく」という売り文句がついていました。

    私自身、コンピュータというかソフトウェアの処理については少々ではありますが知識を持っているつもりでした。

    わからない人のためだと思いますが、図書館のシステムなど一般的な方でも身近と思える題材を扱って、その中で検索エンジンの考え方を表現されていたのですが、読めば読むほどわからなくなっていきました。

    ふーん、、、で、結局どうなっているんだろう。。。
    というのが正直な感想です。

    読んでいる間、ひたすら「?」が出続けてしまったという感想です。

  • フォトリーディングNo.52

    目的:検索エンジンの基本を押さえる

    トリガーワード:検索、ウェブ、情報、図書館、ISBN、URL、リンク、網羅、クローラ、ロボット、分類問題、文字コード、識別規則、学習、全文検索、キーワード、スループット、索引、文字列、二分探索、ツメカケ、的確さ、リファレンス、タイトル、スコア、コスト、類義語、多義語、概念、キャタピラー、個人特性、フィルタリング、リコメンデーション

    質問:①怪しいトリガは?
    ②おさえるべき周辺技術は?

    ~20120616ポストレビューここまで~
    ~20120618アクティベーションここから~

    質問に対するまとめ:
    ①ISBN:書籍を一意に。版数問わず同一。雑誌は含まない。
    分類問題:URLが異なり、返す内容が同一(あるいは別)。収穫可能(公開/非公開)という区別を、潜在パターンを見抜くことで判別制度を高める。
    ツメカケ:時点の側面にある小口見出し。先頭文字とその先頭文字で始まるページ数の情報。
    ②文字コード、検索アルゴリズム、文書の概念(抽象化、類義語、同義語)

    雑感:アルゴリズム等が解らなくても読める内容。概念的な話が多いので、実装部分について要確認の必要あり。

  • わかりやすいことを売りにしていたけど,やはり索引付きデータの説明は難しかった.前提知識のない人は理解できるのだろうか.

  • Web検索エンジンがどのような仕組みで動いているかについて、「できる限りやさしい表現」で解説した、日経BPの「なぜ~」シリーズの1冊。著者の所属する会社は、ニワンゴやガジェット通信の株主で、検索エンジンの開発でも有名な未来検索ブラジル。

    第1・2章は導入であり、古代~現代の図書館の類推で、検索エンジンが目指すもの、必要とされる要件について述べている。

    以降は技術的な内容に移る。第3章では検索エンジンが、集めてきた情報をどう格納し (indexing)、迅速な検索を実現しているかについて説明する。また、第4章ではユーザが入力した検索文から、ユーザが望む結果を適切に提示するための技術 (scoring, filtering) について解説している。

    全体として平易な文章、多様な例やアナロジーの工夫によって、非技術者にとってはわかりやすい書籍であると思われ、検索エンジンと、そこで使われる技術の概要をつかむことができる。数式は全くといって出てこないのも、苦手な読者にとっては親切であるとおもわれる。

    ただ、やや無理にアナロジーにしたために、回りくどくなっている点もあることを指摘しておきたい。3章ではindexingを実現するためのデータ構造について、図鑑、「ツメカケ」、木の札と紐などに例えて説明しているが、説明している内容は、情報科学の「アルゴリズムとデータ構造」の教科書に載っているような細かいものであり、それならいっそのこと専門書的に書いても良かったのではないかと思う。私にとっては読みにくかった。

    また、記述の詳細度のアンバランスさも、やや気になった。3章の記述が微に入り細に入っているのに対して、第4章のスコアリングやフィルタリングの解説は、ややあっさりしていて、日本語処理の重要な技術である形態素解析にほとんど触れていないことや、ゲーム理論についてはおまけ程度の記述であることも不満である。協調フィルタリングなどに始まる推薦システムについてもより充実した記述が望まれる。おそらく著者の専門分野や、彼らの会社が開発しているエンジンのセールスポイントに起因しているのではないかと推測する。

    全体としては、関連文献への参照も適度になされており、読みにくさを除けば、この分野に詳しくない技術者には参考になる内容だった。非技術者には★5、技術者にとっては★3としたい。前述した記述内容のバランスが改善されれば★4としたいと思った。

  • 文字列マッチング処理と自然言語処理の基本を解説した本。検索エンジンに限らず文字列を扱うプログラムを書いている人は読むべし。高速化や索引サイズ削減、ランキング処理、類似度判定と扱っている範囲も幅広い。全編を通して図書館の仕組みと対比しながら数式を使わずに説明されていて好感が持てた。

  • 10年後も使える、か?微妙。図書館の歴史など雑学としては面白い。検索技術の説明も面白い。けれど、何かが足りない。分かったようで分からない。なぜだろう。

    ・重要なのはひとたび決められた分類基準が「ぶれ」なく運用されているかどうかであって、分類基準そのものが客観的に妥当かどうかはあまり重要な事ではないのです。+次ページのメルヴィル・デューイの話。
    ・情報要求の段階。1.正確に用語が分かっている質問。2.自分の言葉で言い切れる質問。3.一言では表せない質問
    ・さらに3.は1.質問の主題、2.同期や目的、3.利用者の個人特性、4.期待されている回答の形に着目すべき。

  • 検索エンジンの仕組みがわかりやすく紹介されています。この本を読んで普段何気なく使っているGoogleがどのようなことをしているのか、どれだけすごいことをしているのかが少しわかるようになりました。
    検索エンジンは私たちの身のまわりになくてはならない物になっていますが、その仕組をわかりやすく説明している本はあまりない気がします。この本はその仕組がわかりやすく説明されている貴重な本です。

  • 検索エンジンの基本、集める まとめる 検索する という機能を図書館のやりかたになぞらえて説明している。

    とてもわかりやすい良書。

    専門的な部分は最後に少しふれている程度。

  • わかりやすく検索エンジンのしくみをまとめている。検索エンジンをこれから知りたい人向け。

全32件中 1 - 20件を表示

森大二郎の作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×