『データサイエンティスト養成読本 機械学習入門編』を再読した

データサイエンス、機械学習について復習のため、
過去に読んだ『データサイエンティスト養成読本 機械学習入門編』をもう一度読んだ。

datascience

この本は、データサイエンス・機械学習ではじめに読む本としてはとてもいいと思う。
内容も平易で文章も読みやすい。
機械学習はこういうものです、というのをわかりやすく教えてくれる。

前半はデータサイエンス・機械学習の概要から基礎、理論、それらのユースケースについてわかりやすく説明されている。
後半はライブラリを使った実践となっている。

後半部分はエンジニアじゃないと読んでもしょうがない内容だと思うが、 前半部分は非エンジニアにも読んでもらいたい内容だった。
ビジネスにどう統計的手法・機械学習が使えるかヒントを与えてくれる。

出版されたのが、2015年10月ということで最新の内容ではない。
例えば、TensorFlowについては言及されていない。
しかし、前半部分の機械学習についての説明は今も大枠は変わらないので、何を読んだらわからないという方はこれを読んでみるのもいいかもしれない。

ふたつ残念だと感じる点があった。
ひとつはディープラーニングについての実践についての内容が乏しいことである。
ディープラーニングの隆盛で昨今の機械学習ブームが訪れたにも関わらず、理論的な説明に終始してばかりで、
Chainerなどを使ってディープラーニングなどといった、もっと実践的な内容に触れてほしかった。

もうひとつは、最後の特集のJubatusはあまり面白くなかった。
オンラインでやれることは魅力的ではあるが、やれることも限られているし(現在はどうかわからないが)、
何より宣伝の匂いを感じてしまう…

ただ、これらを差し引いてもこの本はいい本だと思う。 先日読んだオライリーの『ゼロからはじめるデータサイエンス』よりわかりやすい。
というのは数学的知識が先にあげた本よりは必要とされないからかもしれない。
いずれにせよ、この分野を学ぶなら数学・統計の知識は必須だが…

本の内容は以下のとおり。

第1部 しくみと概要を学ぼう
  特集1 機械学習を使いたい人のための入門講座
    第1章 機械学習の概要
    第2章 機械学習の歴史と今後の応用例
    第3章 データサイエンティストのための機械学習
    第4章 Q&Aとまとめ
  特集2 機械学習の基礎知識
    第1章 機械学習の問題設定
    第2章 教師あり学習
    第3章 教師なし学習
    第4章 応用
  特集3 ビジネスに導入する機会学習
    第1章 ビジネスデータのクラスタリング
    第2章 予測モデルの構築
  特集4 深層学習最前線
    第1章 準備
    第2章 多層パーセプトロンの書き方
    第3章 ニューラルネットの学習方法
    第4章 画像認識のためのアーキテクチャ
第2部 手を動かして学ぼう
  特集1 機械学習ソフトウェアの概観
    第1章 開発が進む機械学習のソフトウェア
    第2章 機械学習のソフトウェアを用いた実行例
    第3章 機械学習ソフトウェア選択の指針
  特集2 Pythonによる機械学習入門
    第1章 イントロダクション
    第2章 Numpy, Scipy, matplotlibの基礎
    第3章 scikit-learn入門
  特集3 推薦システム入門
    第1章 推薦システムのキホン
    第2章 推薦システムを作る
    第3章 推薦システムの高度化
    第4章 良い推薦システムを作るために
  特集4 Pythonで画像認識にチャレンジ
    第1章 画像認識とは?
    第2章 準備
    第3章 シンプルな画像認識を実装
    第4章 猫顔検出に挑戦
  特集5 Jubatusによる異常検知
    第1章 はじめに
    第2章 アーキテクチャ
    第3章 テストデータからの異常検知
    第4章 サーバログからの異常検知

これでデータサイエンス・機械学習の基本的な知識は身につけたから次は数学・統計を学びつつ実践していこうかと思う。