教師あり・教師なし・強化学習を「ユースケース→手法」で迷わず選ぶコツ

AWS Certified AI Practitioner（AIF-C01）では、AI/MLの用語や概念を「言葉として知っている」だけでなく、状況に応じてどう整理して理解しているかが問われやすいです。試験ガイドでも、AI/MLの基本用語や概念の説明がドメイン1の範囲として示されています。

この記事では、機械学習の代表的な3つの学習（教師あり学習・教師なし学習・強化学習）を、暗記ではなく**「ユースケース→手法」**の順に当てはめて理解できるように整理します。AWS上でのイメージが湧くように、SageMakerなどの例も交えます。

AIF-C01対策で評価の高いUdemy講座をまとめて確認できます。👇
セール時は1,500円前後で購入できることもあります。

➤　AIF-C01対策｜Udemy講座を今すぐチェックする

まず押さえる前提：学習の種類は「目的」と「データの状態」で決まる
教師あり学習は「正解つきデータで予測する」
教師なし学習は「正解なしデータから構造を見つける」
強化学習は「行動して報酬を最大化する」
迷ったときの「ユースケース→手法」逆引き早見
AIF-C01向けの学び方：暗記より「判断プロセス」を作る
まとめ：3つの学習は「データ」「目的」「フィードバック」で決まる

まず押さえる前提：学習の種類は「目的」と「データの状態」で決まる

最初に結論を置くと、学習の種類を決める最大の分岐はだいたいこの2つです。

目的：予測したいのか（数値・ラベル）、似ているものを分けたいのか、意思決定を最適化したいのか
データの状態：正解ラベルがあるのか、ないのか、環境から報酬が返ってくるのか

AWSの公式ドキュメントでも、教師あり・教師なし・強化学習は基本パラダイムとして整理されています。

ここから先は、ユースケースを先に見て「これはどれ？」と逆引きできるようにしていきます。

教師あり学習は「正解つきデータで予測する」

教師あり学習は、ざっくり言うと**“答え合わせできるデータ”で学習して、未知のデータを予測する**やり方です。AWSの説明でも、ラベル付きデータ（正解つき）を使い一般化する、という趣旨で整理されています。

よくあるユースケース

分類（カテゴリ当て）
例：メールがスパムかどうか、問い合わせが「解約/請求/障害」どれか、画像が「犬/猫」どれか
回帰（数値予測）
例：来月の売上、配達時間、住宅価格
ランキング（並び替え）
例：検索結果の順位、レコメンドの並び順

判断の合言葉：「正解ラベルはある？」

教師あり学習に向くかどうかは、まずここです。

過去データに「正解」が付いている
- 例：過去の問い合わせに“正しいカテゴリ”が付いている
- 例：過去の取引に“実際の売上額”がある

もし正解がない場合、教師ありは（そのままでは）成立しません。正解を付ける（ラベリング）コストも含めて設計する必要があります。

AWSでのイメージ（SageMaker中心）

AWS上で教師ありを扱う代表例として、Amazon SageMakerで学習ジョブを回して分類・回帰モデルを作る流れがよく挙げられます（アルゴリズム選択のガイドでも、教師あり学習は基本の区分として説明されています）。

教師なし学習は「正解なしデータから構造を見つける」

教師なし学習は、正解ラベルがないデータから、データの“まとまり”や“特徴”を見つけるやり方です。AWSも教師なし学習を基本パラダイムとして整理し、SageMakerではクラスタリングや次元削減、異常検知などに触れています。

よくあるユースケース

クラスタリング（似たもの同士をまとめる）
例：顧客を購買傾向でセグメント分け、ログを行動パターンでグルーピング
次元削減（特徴を圧縮して見通しをよくする）
例：多すぎる特徴量を圧縮して可視化・前処理に使う
異常検知（“いつもと違う”を見つける）
例：アクセス急増、センサーの異常値、決済の不正っぽい動き

判断の合言葉：「正解を用意できない、でもパターンを掴みたい」

教師なし学習は、次の状況で選びやすいです。

正解ラベルを付けるのが現実的でない
まずはデータの傾向を掴んで、仮説を作りたい
“いつもと違う”を検知したいが、正解の定義が難しい

たとえば「不正検知」は教師ありでも教師なしでも登場します。

過去の不正ラベルが十分ある → 教師ありで“当てに行く”
不正が稀でラベルが揃わない → 教師なしで“逸脱を拾う”
という整理ができると、暗記に頼らず判断できます。

AWSでのイメージ（SageMaker中心）

SageMakerには教師なしタスク向けの組み込みアルゴリズム群があり、クラスタリングや次元削減、異常検知などの用途が挙げられています。

強化学習は「行動して報酬を最大化する」

強化学習は、教師あり/教師なしとは発想がかなり違って、エージェントが環境に対して行動し、返ってくる報酬（ペナルティ）を最大化するように学習する枠組みです。AWSの公式解説やSageMakerの開発者ガイドでも、教師あり・教師なしとの違いとしてこの点が整理されています。

よくあるユースケース

経路・配車・在庫補充などの最適化（状態が変わり続ける）
ゲームAIやロボット制御（行動の連続で成果が決まる）
広告配信の方策最適化（長期的な成果を追う）

ポイントは、**「正解データを当てる」より「意思決定の戦略（ポリシー）を良くする」**ことです。

判断の合言葉：「行動 → 結果（報酬）が返る、を繰り返せる？」

強化学習を選ぶ条件は、だいたいこの2つです。

行動の結果が、報酬という形で評価できる（スコア化できる）
試行錯誤できる環境がある（現実でやると危険ならシミュレーションが必要）

AWSの説明でも、自動運転のように複雑で動的な環境で、シミュレーション内で報酬に基づき学習していく例が紹介されています。

AWSでのイメージ（SageMaker中心）

SageMakerの強化学習機能（ガイド）では、強化学習の位置づけや、環境・エージェントなどの構成要素が整理されています。

迷ったときの「ユースケース→手法」逆引き早見

ここまでを、現場でも試験でも使えるように、ユースケース起点で当てはめます。

「当てたいもの」が明確なら教師あり

問い合わせカテゴリを当てたい → 分類（教師あり）
売上や需要を予測したい → 回帰（教師あり）
“正解ラベル”が過去にある／作れる → 教師ありが第一候補

「分け方が分からない」なら教師なし

顧客を似た傾向で分けたい（正解の区分がない） → クラスタリング（教師なし）
ログから“いつもと違う”を拾いたい → 異常検知（教師なしが候補）
まずは構造発見・特徴抽出が目的 → 教師なしが第一候補

「選択の連続」で成果が決まるなら強化学習

その場その場で行動を選び、長期の成果を最大化したい → 強化学習
報酬を定義でき、試行錯誤できる環境がある → 強化学習が候補

そして最後に、AWSのドキュメントでも触れられている通り、3つは完全に排他的というより「目的と条件で使い分ける」ものです。

AIF-C01向けの学び方：暗記より「判断プロセス」を作る

AIF-C01のドメイン1は、AI/MLの基本用語や概念の整理が土台になります。
ここで差がつきやすいのは、用語の丸暗記よりも「状況を聞かれたときに整理できるか」です。

おすすめの学び方は次の流れです。

ラベルの有無で教師あり/なしをまず分ける
行動と報酬が成立するなら強化学習を検討する
具体例を1つずつ、自分の言葉で説明できるようにする
- 「問い合わせ分類はなぜ教師あり？」
- 「顧客セグメントはなぜ教師なし？」
- 「配車最適化はなぜ強化学習になりがち？」

もし独学で散らかりやすい場合は、体系的に整理された教材を1つ持つのも手です。たとえば UdemyのAIF-C01対策講座のように、章立てで概念→ユースケース→AWSサービスの順に並んでいるものは、理解の抜け漏れを減らす助けになります（講座は相性があるので、目次とレビューで選ぶのが現実的です）。

AIF-C01対策で評価の高いUdemy講座をまとめて確認できます。👇
セール時は1,500円前後で購入できることもあります。

➤　AIF-C01対策｜Udemy講座を今すぐチェックする