『データサイエンティスト養成読本 機械学習入門編』を再読した
12 Mar 2017データサイエンス、機械学習について復習のため、
過去に読んだ『データサイエンティスト養成読本 機械学習入門編』をもう一度読んだ。
この本は、データサイエンス・機械学習ではじめに読む本としてはとてもいいと思う。
内容も平易で文章も読みやすい。
機械学習はこういうものです、というのをわかりやすく教えてくれる。
前半はデータサイエンス・機械学習の概要から基礎、理論、それらのユースケースについてわかりやすく説明されている。
後半はライブラリを使った実践となっている。
後半部分はエンジニアじゃないと読んでもしょうがない内容だと思うが、
前半部分は非エンジニアにも読んでもらいたい内容だった。
ビジネスにどう統計的手法・機械学習が使えるかヒントを与えてくれる。
出版されたのが、2015年10月ということで最新の内容ではない。
例えば、TensorFlowについては言及されていない。
しかし、前半部分の機械学習についての説明は今も大枠は変わらないので、何を読んだらわからないという方はこれを読んでみるのもいいかもしれない。
ふたつ残念だと感じる点があった。
ひとつはディープラーニングについての実践についての内容が乏しいことである。
ディープラーニングの隆盛で昨今の機械学習ブームが訪れたにも関わらず、理論的な説明に終始してばかりで、
Chainerなどを使ってディープラーニングなどといった、もっと実践的な内容に触れてほしかった。
もうひとつは、最後の特集のJubatusはあまり面白くなかった。
オンラインでやれることは魅力的ではあるが、やれることも限られているし(現在はどうかわからないが)、
何より宣伝の匂いを感じてしまう…
ただ、これらを差し引いてもこの本はいい本だと思う。
先日読んだオライリーの『ゼロからはじめるデータサイエンス』よりわかりやすい。
というのは数学的知識が先にあげた本よりは必要とされないからかもしれない。
いずれにせよ、この分野を学ぶなら数学・統計の知識は必須だが…
本の内容は以下のとおり。
第1部 しくみと概要を学ぼう
特集1 機械学習を使いたい人のための入門講座
第1章 機械学習の概要
第2章 機械学習の歴史と今後の応用例
第3章 データサイエンティストのための機械学習
第4章 Q&Aとまとめ
特集2 機械学習の基礎知識
第1章 機械学習の問題設定
第2章 教師あり学習
第3章 教師なし学習
第4章 応用
特集3 ビジネスに導入する機会学習
第1章 ビジネスデータのクラスタリング
第2章 予測モデルの構築
特集4 深層学習最前線
第1章 準備
第2章 多層パーセプトロンの書き方
第3章 ニューラルネットの学習方法
第4章 画像認識のためのアーキテクチャ
第2部 手を動かして学ぼう
特集1 機械学習ソフトウェアの概観
第1章 開発が進む機械学習のソフトウェア
第2章 機械学習のソフトウェアを用いた実行例
第3章 機械学習ソフトウェア選択の指針
特集2 Pythonによる機械学習入門
第1章 イントロダクション
第2章 Numpy, Scipy, matplotlibの基礎
第3章 scikit-learn入門
特集3 推薦システム入門
第1章 推薦システムのキホン
第2章 推薦システムを作る
第3章 推薦システムの高度化
第4章 良い推薦システムを作るために
特集4 Pythonで画像認識にチャレンジ
第1章 画像認識とは?
第2章 準備
第3章 シンプルな画像認識を実装
第4章 猫顔検出に挑戦
特集5 Jubatusによる異常検知
第1章 はじめに
第2章 アーキテクチャ
第3章 テストデータからの異常検知
第4章 サーバログからの異常検知
これでデータサイエンス・機械学習の基本的な知識は身につけたから次は数学・統計を学びつつ実践していこうかと思う。