- Amazon.co.jp ・本 (301ページ)
- / ISBN・EAN: 9784320124769
作品紹介・あらすじ
本書は,ビッグデータ時代にますます必要となる,データの組み合わせあるいは仮説の組み合わせによって新たな仮説を構築する方法を具体例とともに解説する。
通信システムの向上によって,これまで以上に大容量のデータが高速(リアルタイム)で生成されるようになっている。さらにIoTデバイスなどの普及によって,実世界データ,ソーシャルデータ,オープンデータを含む多種多様なデータが得られるようになり,それらを同時に取り扱う必要性がますます大きくなってきている。しかしながら異なるデータをどう組み合わせれば有用な仮説が得られるかは必ずしも自明ではない。ましてビッグデータに人工知能などの最新技術を適用しても,自動的に仮説が作られるという保証はない。
本書では具体的な事例とともに,ビッグデータを活用する応用システムのための基盤的技術となる統合的な仮説生成の方法を,データ分析(人工知能,データマイニング)とデータ管理(データベース)の技術を調和的に利用したアプローチに基づいて説明している。また科学史において,天文学・物理学の分野ではケプラー,ガリレオ,ニュートン,集団遺伝学の分野ではダーウィン,ゴルトン,ピアソン,メンデル,フィッシャーらの仮説生成の方法を辿りながら,その基本となる演繹,帰納,もっともらしい推論,類推,問題解決について学ぶことができる。さらにビッグデータを用いた仮説生成の方式として,複数の仮説間の差分,重ね合わせ,和分,結合の各方法についての具体例も詳述している。
データサイエンティストやデータエンジニアを含め,広くデータ応用に関わる人や将来それらの職業を目指す学生に手にとっていただきたい一書である。
感想・レビュー・書評
-
【書誌情報】
著者 石川 博
分野 データサイエンス
情報科学
コンピュータ系
発売日 2021/09/30
ISBN 9784320124769
体裁 A5・320頁
定価 3,740円 (本体3,400円 + 税10%)
本書は、ビッグデータ時代にますます必要となる、データの組み合わせあるいは仮説の組み合わせによって新たな仮説を構築する方法を具体例とともに解説する。
通信システムの向上によって、これまで以上に大容量のデータが高速(リアルタイム)で生成されるようになっている。さらにIoTデバイスなどの普及によって、実世界データ、ソーシャルデータ、オープンデータを含む多種多様なデータが得られるようになり、それらを同時に取り扱う必要性がますます大きくなってきている。しかしながら異なるデータをどう組み合わせれば有用な仮説が得られるかは必ずしも自明ではない。ましてビッグデータに人工知能などの最新技術を適用しても、自動的に仮説が作られるという保証はない。
本書では具体的な事例とともに、ビッグデータを活用する応用システムのための基盤的技術となる統合的な仮説生成の方法を、データ分析(人工知能、データマイニング)とデータ管理(データベース)の技術を調和的に利用したアプローチに基づいて説明している。また科学史において、天文学・物理学の分野ではケプラー、ガリレオ、ニュートン、集団遺伝学の分野ではダーウィン、ゴルトン、ピアソン、メンデル、フィッシャーらの仮説生成の方法を辿りながら、その基本となる演繹、帰納、もっともらしい推論、類推、問題解決について学ぶことができる。さらにビッグデータを用いた仮説生成の方式として、複数の仮説間の差分、重ね合わせ、和分、結合の各方法についての具体例も詳述している。
データサイエンティストやデータエンジニアを含め、広くデータ応用に関わる人や将来それらの職業を目指す学生に手にとっていただきたい一書である。
[https://www.kyoritsu-pub.co.jp/book/b10003356.html]
【目次】
口絵写真(17枚) [/]
はじめに(2021年8月 柿生にて 石川博) [iii-iv]
目次 [v-vii]
第1章 基本概念
1.1 5G時代のビッグデータ 001
1.2 処理の高速化 004
1.3 ビッグデータ応用 013
第2章 仮説
2.1 仮説とは何か 015
2.2 仮説生成のヒント 020
2.3 可視化 021
2.4 推論 025
2.5 問題解決 037
2.6 身近な問題解決 041
2.7 科学と仮説 052
第3章 回帰
3.1 回帰の基本 073
3.2 回帰,相関から因果関係へ 098
第4章 クラスタリングとニューラルネットワーク
4.1 クラスタリング 121
4.2 アーティフィシャルニューラルネットワークまたは深層学習 142
4.3 統合的仮説生成 160
第5章 差分による仮説生成
5.1 仮説差分法 169
5.2 時間における差分 170
5.3 空間における差分 198
5.4 概念空間における差分 210
5.5 仮説間差分 229
第6章 仮説間補完,仮説間重ね合わせ,そして仮説間和分
6.1 概要 243
6.2 仮説間補完 245
6.3 モビリティサービスのための機械学習を用いた自動車の異常振動検知(仮説間重ね合わせ1) 258
6.4 かぐやDEMを用いた,機械学習による中央丘クレーター識別(仮説間重ね合わせ2) 267
引用文献 [281-]294
索引 [295-301]
Column 目次
1 オッカムの剃刀 016
2 数学的帰納法 030
3 フィボナッチ数列 070
4 探さなければ見つからない 082
5 ダイアグラム 111
6 教師あり学習と教師なし学習 123
7 行動経済学 177
8 差分方程式 198
9 アポロ15号とNAC 画像 210
10 アンサンブル学習 245詳細をみるコメント0件をすべて表示 -
『#仮説のつくりかた』
ほぼ日書評 Day572
たまたま同時に読み進めた本達が、なかなかに難解なものばかりで、進みが遅く、あるいは積読送りになったりして、1週間ぶりの更新になってしまった。
この本も、一般の人には「難書」と思う。『仮説思考』のようなロジカル系のビジネス書かと思って手に取ったところ、まるまる数学系、データ解析手法の解説書で、正直、中盤はわかるところだけ拾い読みという状態だった。
とはいえ、まるっきり役に立たないかといえば、むしろ逆で、ビックデータ分析から導かれる推論に、そうした計算式・解析手法を当てはめることで、その「仮説」の確らしさを見定めよう、という手順は極めて面白い。
また、それらが、観光地でもっと携帯の基地局やフリーwifiポイントを増やした方が良い場所を、人の流れとツイート数から割り出すであるとか、ツイートで用いられる用語の利用頻度とシチュエーションを掛け合わせて解析することで、投稿者の心理状態を推しはかるとか、非常に具体的で、示唆に富む。
終盤で扱われる、大地震が起きた時に避難すべきルート分析等は、身につまされるトピックである。
冒頭に述べた通り、簡単に読める本ではないが、たまには毛色を変えてみたいという方は、ぜひ図書館で。
https://amzn.to/3V97AJh -
あるテーマについて語りながらいろんな技術を紹介する本
すごく広く網羅してるけどその分浅いなあと。このあたりすべて知っておいて損はないので確認にはなる。まあ当然深くは話してない。 -
仮説に至るまでの考え方と、実際の適用と
-
第1章 基本概念
1.1 5G時代のビッグデータ
1.2 処理の高速化
1.3 ビッグデータ応用
第2章 仮説
2.1 仮説とは何か
2.2 仮説生成のヒント
2.3 可視化
2.4 推論
2.5 問題解決
2.6 身近な問題解決
2.7 科学と仮説
第3章 回帰
3.1 回帰の基本
3.2 回帰,相関から因果関係へ
第4章 クラスタリングとニューラルネットワーク
4.1 クラスタリング
4.2 アーティフィシャルニューラルネットワークまたは深層学習
4.3 統合的仮説生成
第5章 差分による仮説生成
5.1 仮説差分法
5.2 時間における差分
5.3 空間における差分
5.4 概念空間における差分
5.5 仮説間差分
第6章 仮説間補完,仮説間重ね合わせ,そして仮説間和分
6.1 概要
6.2 仮説間補完
6.3 モビリティサービスのための機械学習を用いた自動車の異常振動検知(仮説間重ね合わせ1)
6.4 かぐやDEMを用いた,機械学習による中央丘クレーター識別(仮説間重ね合わせ2) -
請求記号 007.6/I 76
-
タイトルはこれでいいのだろうか
データ解釈法ないしはデータ分析法
的な内容であり、仮説のつくり方、に期待してしまうとちょっと減点かも