教師あり学習&教師なし学習とは

機械学習ではデータを元に様々な分析や予測を行います。このときの学習方法は一般的に3種類です。

  • 教師あり学習
  • 教師なし学習
  • 強化学習

学習方法はどれが優れているというものではなく、人工知能に解決させたい課題に応じて使い分けて行うものです。今日はその中でも教師あり学習と教師なし学習をピックアップして、具体的にどういったシーンで使うものなのかを紹介していきます。

教師あり学習とは?

教師あり学習では、予測したい結果である正解データを用意して学習を行います。未知のデータから正解データとなるものを予測するのが教師あり学習です。その名の通り、「教師データがある」学習方法であるため、教師データがない場合には使うことができません。

教師あり学習で予測できるものは2種類あり、それが「回帰」と「分類」です。

回帰

ある連続した数値から未来を予測する際に使用します。
たとえば企業の売上予測、倉庫の在庫量の変化、店舗への来店者数の予測などです。

時系列で変化するデータを用いて予測を行う際には回帰を用います。

識別

文字通り、データを識別したいときに使用します。
画像認識系の予測は識別に当たります。
レントゲン写真から症例を判断するときや、車の自動運転で人とモノを識別する際などに用いるのが識別です。

画像認識に限らず、文字や動画をデータにした分析でも使用します。AとBにわけて判定したいときに用いるものが識別です。

教師なし学習とは?

教師なし学習では、教師データが存在しない状態で学習を行います。データから規則性・法則性を見つけ出します。教師データを用いず(用意せず)に分析を行うので教師なし学習と言います。

教師なし学習では主に「クラスタリング」と「次元削減」を行います。

クラスタリング

クラスタリングはデータを似たような特性を持つものに分類します。正解が何かを特定せずに、分類するものであり、教師あり学習の識別とは性質が異なるものです。

たとえばある商品の購入層をクラスタリングすると、顧客1人1人が持つ特徴量を分析し、顧客を分類します。顧客の分類という観点ですと似たような分析としてたとえばRFM分析がありますが、RFM分析の場合には、日付・金額・頻度の3つの軸でしか分析ができません。機械学習を用いたクラスタリングのほうが精緻な分析を行うことができます。

次元削減

次元削減はデータの簡略化を行うものです。データの簡略化を行うことで、個別にデータを見ていたときには気づきにくいデータ間の相関関係を可視化することができます。データが多次元すぎて解釈がしづらいときに、主としてデータの分散に着目して次元を削減します。

それぞれの用途まとめ

教師あり学習と教師なし学習のそれぞれの意味・役割を図にまとめました。

教師あり学習教師なし学習
教師データありなし
できること回帰・識別クラスタリング・ 次元削減
具体例売上予測・画像認識データの切り出し・可視化

またどの手法を使えば良いのか迷ったときには、予測したいものが値なのかカテゴリーなのかで分類することをオススメします。
教師ありか教師なしか、予測対象が数値かカテゴリーかの2軸で以下のように考えるとどの手法を用いればよいのか簡単にわかります。

教師あり学習教師なし学習
予測対象が数値回帰次元削除
予測対象がカテゴリー識別クラスタリング

教師あり学習・教師なし学習はAIデータ分析を考えるときには切っても切り離せない重要概念です。ぜひ参考にしてください。

 

マーケターの方向けの、マーケティングにAI活用が進まない3つの理由とその解決策についてまとめた資料を無料で配布しています。

お気軽にダウンロードしてみてください。

>無料でDLする<