IPythonデータサイエンスクックブック ―対話型コンピューティングと可視化のためのレシピ集

  • オライリージャパン
4.33
  • (6)
  • (4)
  • (2)
  • (0)
  • (0)
本棚登録 : 147
感想 : 10
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (508ページ)
  • / ISBN・EAN: 9784873117485

作品紹介・あらすじ

Pythonの対話環境IPythonを使ってデータ分析を行い結果を可視化するレシピ集!
本書はPythonの対話型環境IPythonを使ってデータ分析および可視化を行うためのレシピを集めたクックブックです。IPythonではPythonの豊富な科学技術計算用のライブラリを簡単に使いこなせるため、プログラミングに必ずしも精通しているわけではない科学者やデータサイエンティストの救世主として、人気を集めています。実際のデータを分析して可視化するという作業を通して、IPythonの使い方をマスターします。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 積読してた古い本だが、IPythonに限らず役に立つ記述が多かった
    新しい類書で良い本がたくさん出ているので、必読とまでは言わないが読んで損のない内容

  • メインWebページ(セコンドバージョン)
    https://github.com/ipython-books/cookbook-2nd-code

    てんこもりです

    1章 IPythonによる対話的コンピューティング
     JupyterはPythonの実行環境であるがそれ以外にもいろいろな
     機能がある。マジックコマンド、MarkDown、数式も記述できる
     画像もYouTube動画も表示できる
     pandasによるデータ分析のの解説、NumPyによる多次元配列
     IPython自身の設定方法など

    2章 対話的コンピューティングのベストプラクティス
     IPythonをGitで管理する方法を解説。Prtojectのフォルダ構成の
     お勧め例など。Pythonを書くときの推奨スタイル、テストツールの紹介
     デバック、デバッガの紹介

    3章 IPython notebookを使いこなす
     IPythonの表示をCSSを使って細かく制御する

    4章 プロファイリングと最適化
     マジックコマンド%timeit,%%timeitを使った実行時間の測定方法
     cProfileとIPythonによるコードプロファイル、memory_profileを
     使ったメモリ使用状況レポート。NumPyを効率よく操作するための
     テクニック。HDF5とPyTablesによる巨大配列の操作

    5章 ハイパフォーマンスコンピューティング
     Pythonで高速で処理したい場合の手段が解説されている
     ・マルチプロセス
     ・Cythonを使う方法
     ・Numbaを使う方法
     ・Numexprを使う方法
     ・cudaを使う方法
     ・OpenCLを使う方法
     ・IPythonのparallelを使う方法
     最後にPythonではないJuliaを取り上げている

    6章 先進的ビジュライゼーション
     matplotlibとその周辺の描画の話題
     ・prettyplotlib
     ・seaborn
     ・Bokeh
     ・D3.js,NetworkXによるグラフネットワークの可視化
     ・mpld3を使ったmatplotlibを図をD3.jsに変換

    7章 統計データ解析
     pandasとmatplotlibを使った探索的データ分析
     統計的な話題、R言語をIPythonから実行する

    8章 機械学習
     scikit-learnを使った機械学習

    9章 数値最適化
     scipyを使った最適化

    10章 信号処理
     高速フーリエ変換

    11章 画像処理と音声処理
     画像処理(フィルタ、画像分割、特徴点の抽出)

    12章 決定論的力学系
     省略

    13章 確率力学
     省略

    14章 グラフ、幾何学、地理情報システム
     NetworkXによるグラフ操作
    Shapely,basemapによる地理情報

    15章 記号処理と数値解析
     SymPyによる数式処理

  • 機械学習やその他データサイエンスに必要なモデルを概観できる。コードのミスが多いこと、ディープラーニングや教師なし学習のサンプルのすくなさには多少不満はあるものの、決定論的力学系以降の話は特に興味範囲だったので面白かった。特にロジスティック方程式のシミュレーションができて感動した。そしてsageなどで本当に数学という分野がほとんどCSに取られていくかもしれないと感じた。全体を通してNotebookでは非常に簡単に数学やモデルを扱える。

    機械学習については補足的に特化した本を別に読んだ方がいいと思う。

  • 様々な問題に対してPythonで解いた実績があるという紹介
    IPythonのみの話はクスない
    「紹介」なので細部はあまりない

    5章 Num Expr
    ipcluster start -n 4
    %%px
    v = rc[:]
    v.map(~)

    MPI
    julia

    後半はデータサイエンスより(の活用例紹介)

  • ・magicの使用、%%writefile test.txt
    ・Jupyter上でpandasを使ってデータ操作と可視化
    ・Numpyを使って計算が通常のPythonで計算したよりも高速であることを確認
    ・カスタムmagicコマンドを作成して使う

  • 請求記号 007.64/R 73

全10件中 1 - 10件を表示

Cyrille Rossantの作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×