コマンドラインではじめるデータサイエンス ―分析プロセスを自在に進めるテクニック
- オライリージャパン (2015年9月16日発売)
- Amazon.co.jp ・本 (272ページ)
- / ISBN・EAN: 9784873117416
作品紹介・あらすじ
シェルを活用してデータ分析の一連の作業を効率化!
本書はコマンドライン初学者に向けてコマンドライン処理の基礎からデータ分析に必要な操作を解説。分析実務の大半を占めるデータの取得~加工~分析というタスクの流れに従って、各種ツールの説明が行われています。仮想マシンを使うことでWindowsでもサンプルを実行できるようになっているため、普段Windows/GUI環境でデータ分析をしている人にも理解しやすい内容です。
感想・レビュー・書評
-
初版を読んだ。些細ではあるが、たまに誤字がある
Unixのシェル{コマンド,スクリプト}を初学する人にとっても良い本
普通のプログラミング (主にR言語) に関しては多少心得がある人向け
そういえばよく考えると、データサイエンスをタイトルに冠してる割にはデータ分析自体のテクニックよりはその前後の処理にほとんどを費やしている
そういう意味ではもしかしたらがっかりされるのかも詳細をみるコメント0件をすべて表示 -
コマンドラインを使って、
データロード→クレンジング→整形→解析処理→可視化
といった流れを勉強するために買った本。
Vagrantを使って仮想環境を構築し、
その中に必要なプログラムやデータセットを入れて、
動かす流れになっているので、すごく作業しやすかった。
コマンドラインだけでもかなりの分析が出来ることが
分かったことは正直かなり勉強になった反面、
実際のデータは目で終えるほどの量ではないので、
欠損値やノイズチェックのアタリのつけ方等を学ぶ手順も
本当はあってもいいのかなって少し思いました。 -
データ分析を行う上で、初物のデータを扱う時は、試行錯誤し「当たりをつける」工程が必要となる。ここをコマンドラインで行おうという提案。
UNIX系OSを扱える人なら、かなりいけます。修論執筆時にこの本に出会えていれば、楽ができたのに、、、orz -
請求記号 007.6/J 23
-
2015/09/18手元に到着した。未読。