『ゼロからはじめるデータサイエンス』を読んだ
06 Mar 2017データサイエンス、機械学習の勉強のために『ゼロからはじめるデータサイエンス』を読んだ。
本書の構成を大きく分けると、1章から11章まではデータサイエンスの土台となる基礎部分について、 12章から22章までは応用、23と24はRDBとMapReduceの説明になっている。
読み進めるとわかるが、各章の内容が浅い…
わずかばかりの用語説明とPythonのコードがあるのみで、あとは各自調べてね、というスタンス。
数学に関する章も多く、途中から高校の教科書を引っ張り出したくらいだ。
Amazonのレビューの評価が低いのもうなづける。
この本だけでデータサイエンスを学ぼうとしているならやめたほうがいい。
これを読むと、データサイエンスという分野が 本一冊で十分に学べるほどではないことがわかる。
これからデータサイエンスを学ぶ足がかりとして読むならいいかもしれない。 データサイエンスについて今後学んでいくにあたって、 どのようなものを学んだらいいかのあたりはつけることができた。
まずは数学の基礎から身につけなくてはいけない。高校の数学から学び直そう。
そうじゃないとわからない…
本の内容は以下のとおり。
はじめに
1章 イントロダクション
2章 Python速習コース
3章 データの可視化
4章 線形代数
5章 統計
6章 確率
7章 仮説と推定
8章 勾配下降法
9章 データの取得
10章 データの操作
11章 機械学習
12章 k近傍法
13章 ナイーブベイズ
14章 単純な線形回帰
15章 重回帰分析
16章 ロジスティック回帰
17章 決定木
18章 ニューラルネットワーク
19章 クラスタリング
20章 自然言語処理
21章 ネットワーク分析
22章 リコメンドシステム
23章 データベースとSQL
24章 MapReduce
25章 前進しよう、データサイエンティストとして
付録A 日本語に関する補足
先に述べたとおり、どの章も話が浅い。
また、Pythonのコードもスクラッチで書いており、この分野では使用することが当たり前のPandas
やNumPy
、scikit-learn
といったライブラリを使ったコードではない…
原題が『Data Science from Scratch』とあるとおりしょうがないんだが。
今後、どういうことを学べばいいか、それを確認するための本としてはよかったと思う。