nikkie-ftnextの日記

イベントレポートや読書メモを発信

Azure Machine Learningの初歩の初歩

はじめに

本年もお世話になりました。nikkieです。
気になっていた「Azure Machine Learning」について調べてみました。
今回はまだ触っていません。機械学習についてまとめた記事です。

元にした資料

2017年3月に開催されたNSStudy #11の動画や記事を元にしました。
(公開していただきありがとうございます!)

講師の畠山さんのスライドを探したところ、以下のものが近かったです。

www.slideshare.net

 

機械学習とは

機械に学習させること。
=データの中のパターンをコンピュータに探させる
→そのためには人が機械に答えを教える必要がある

機械学習では過去にないパターンにも答えを出そうとする。
→if文を書いて実装するのとは異なり、機械学習では汎用性が得られる

機械学習統計学に基づく。

機械学習の主な用途

  1. 回帰(Regression);値を予測する 教師あり学習
  2. 分類分け(Classification):分類を予測する 教師あり学習
  3. クラスタリング(Clustering);データの構造を理解する 教師なし学習

 

注意点

・機械に学習させる上で、人間が判断するべき箇所がある。

  • データ(CSVを想定)の中でどの列を解析に使うのか
  • データの分布に対してどのような境界線を引くのか
    (例:線形か非線形か=アルゴリズムの選択)

・データの用意が一番大変。
 →Azure Machine Learningに用意されているサンプルデータを参考にするとよい

・1件の例外も許してはならないと考えてしまうと過学習(Overfitting)に陥る。
 (過学習=汎用性が損なわれた状態)
 例外が嫌ならif文を書いて実装したほうがよい

・データが増加するとモデルを再度作成する。
 データの加工、モデルの評価を継続的に行う心構えが必要。

・画像や音声の解析は機械学習よりもディープラーニングに分がある

終わりに

機械学習において例外は受け入れるという考え方は勉強になりました。
汎用性との間のトレードオフということなのだと思います。

適切なアルゴリズムの選択には統計の知識がいるので、
使い始めるのは簡単そうですが、使いこなすのが難しそうなツールという印象です。

心構えはできたので、次は実際に触ってみようと思います。

候補