IMG_2562_s

機械学習の技術について説明した書籍は多いですが、データサイエンスとして実際のプロジェクトに適用することを説明した書籍はこれまでになかったと思います。2017年7月の書籍です。

本書では、ABCDEフレームワークと呼ばれる、フレームワークを使うことで機械学習を実際にプロジェクトに適用する方法を説明しています。
  • A = Aim (目的) ・・・この機械脳が何を達成すれば、目的を達成したといえるか
  • B = Brain (機械脳の種類) ・・・この機械脳は、どのようなアルゴリズムを用いているのか
  • C = Coding/Construction (プログラミング作業・実装) ・・・この機械脳のプログラムやサーバー構成はどうなっているのか
  • D = Data (データ選定と整備) ・・・この機械脳はどのようなデータを学習して判断をおこなうのか
  • E = Execution (実行) ・・・この機械脳を実行に移す際の組織プロセス、オペレーション方法はどのようなものか
モデルの選択基準は以下の通り:
  • Accuracy (精度)
  • Interpretation (解釈容易性)
  • Coding/Constuction (プログラミング作業・実装)
  • Speed (速度)
データサイエンティストの3条件:
  • 統計数理上の知識
  • エンジニアリング能力
  • 実務上の経験
どれか1つがかけても不十分。1人のスーパーエンジニアが必ず必要なわけではなく、チームで上記を満たせば良い。

最後に、「時代に追いつき、時代に先んじよ」という言葉で締めくくられています。車の時代に馬車で戦うようなことが無いように、機械学習が主流となりつつある現在は機械学習を学び身につける必要があります。