IPythonデータサイエンスクックブック ―対話型コンピューティングと可視化のためのレシピ集
- オライリージャパン (2015年12月25日発売)
- Amazon.co.jp ・本 (508ページ)
- / ISBN・EAN: 9784873117485
作品紹介・あらすじ
Pythonの対話環境IPythonを使ってデータ分析を行い結果を可視化するレシピ集!
本書はPythonの対話型環境IPythonを使ってデータ分析および可視化を行うためのレシピを集めたクックブックです。IPythonではPythonの豊富な科学技術計算用のライブラリを簡単に使いこなせるため、プログラミングに必ずしも精通しているわけではない科学者やデータサイエンティストの救世主として、人気を集めています。実際のデータを分析して可視化するという作業を通して、IPythonの使い方をマスターします。
感想・レビュー・書評
-
詳細をみるコメント0件をすべて表示
-
メインWebページ(セコンドバージョン)
https://github.com/ipython-books/cookbook-2nd-code
てんこもりです
1章 IPythonによる対話的コンピューティング
JupyterはPythonの実行環境であるがそれ以外にもいろいろな
機能がある。マジックコマンド、MarkDown、数式も記述できる
画像もYouTube動画も表示できる
pandasによるデータ分析のの解説、NumPyによる多次元配列
IPython自身の設定方法など
2章 対話的コンピューティングのベストプラクティス
IPythonをGitで管理する方法を解説。Prtojectのフォルダ構成の
お勧め例など。Pythonを書くときの推奨スタイル、テストツールの紹介
デバック、デバッガの紹介
3章 IPython notebookを使いこなす
IPythonの表示をCSSを使って細かく制御する
4章 プロファイリングと最適化
マジックコマンド%timeit,%%timeitを使った実行時間の測定方法
cProfileとIPythonによるコードプロファイル、memory_profileを
使ったメモリ使用状況レポート。NumPyを効率よく操作するための
テクニック。HDF5とPyTablesによる巨大配列の操作
5章 ハイパフォーマンスコンピューティング
Pythonで高速で処理したい場合の手段が解説されている
・マルチプロセス
・Cythonを使う方法
・Numbaを使う方法
・Numexprを使う方法
・cudaを使う方法
・OpenCLを使う方法
・IPythonのparallelを使う方法
最後にPythonではないJuliaを取り上げている
6章 先進的ビジュライゼーション
matplotlibとその周辺の描画の話題
・prettyplotlib
・seaborn
・Bokeh
・D3.js,NetworkXによるグラフネットワークの可視化
・mpld3を使ったmatplotlibを図をD3.jsに変換
7章 統計データ解析
pandasとmatplotlibを使った探索的データ分析
統計的な話題、R言語をIPythonから実行する
8章 機械学習
scikit-learnを使った機械学習
9章 数値最適化
scipyを使った最適化
10章 信号処理
高速フーリエ変換
11章 画像処理と音声処理
画像処理(フィルタ、画像分割、特徴点の抽出)
12章 決定論的力学系
省略
13章 確率力学
省略
14章 グラフ、幾何学、地理情報システム
NetworkXによるグラフ操作
Shapely,basemapによる地理情報
15章 記号処理と数値解析
SymPyによる数式処理 -
機械学習やその他データサイエンスに必要なモデルを概観できる。コードのミスが多いこと、ディープラーニングや教師なし学習のサンプルのすくなさには多少不満はあるものの、決定論的力学系以降の話は特に興味範囲だったので面白かった。特にロジスティック方程式のシミュレーションができて感動した。そしてsageなどで本当に数学という分野がほとんどCSに取られていくかもしれないと感じた。全体を通してNotebookでは非常に簡単に数学やモデルを扱える。
機械学習については補足的に特化した本を別に読んだ方がいいと思う。 -
様々な問題に対してPythonで解いた実績があるという紹介
IPythonのみの話はクスない
「紹介」なので細部はあまりない
5章 Num Expr
ipcluster start -n 4
%%px
v = rc[:]
v.map(~)
MPI
julia
後半はデータサイエンスより(の活用例紹介) -
・magicの使用、%%writefile test.txt
・Jupyter上でpandasを使ってデータ操作と可視化
・Numpyを使って計算が通常のPythonで計算したよりも高速であることを確認
・カスタムmagicコマンドを作成して使う -
請求記号 007.64/R 73