教師あり学習とは?
状態:-
閲覧数:1,563
投稿日:2016-10-16
更新日:2018-02-17
英語表記
・Supervised learning
過去の膨大なデータの傾向を元に、未知のデータに対して予測をする
・未知のデータに対して過去の経験(=過去のデータ)を元に機械が予測をする
・既知の例を一般化することで、意思決定過程を自動化するもの
・入力と出力のペア群から学習する機械アルゴリズム
Gmail
・「迷惑メール」判定
Amazon
・「この商品を買った人はこんな商品も買っています」の推薦
「封筒に書かれた手書きの数字」からの郵便番号読み取り
・「入力」はスキャンされた手書き文字
・「望まれる出力」は実際の郵便番号
医用画像からの腫瘍の良性・悪性の診断
・「入力」は画像
・「出力」は腫瘍が良性かどうか
・Supervised learning
過去の膨大なデータの傾向を元に、未知のデータに対して予測をする
・未知のデータに対して過去の経験(=過去のデータ)を元に機械が予測をする
・既知の例を一般化することで、意思決定過程を自動化するもの
・入力と出力のペア群から学習する機械アルゴリズム
具体的な使用例
Gmail
・「迷惑メール」判定
Amazon
・「この商品を買った人はこんな商品も買っています」の推薦
「封筒に書かれた手書きの数字」からの郵便番号読み取り
・「入力」はスキャンされた手書き文字
・「望まれる出力」は実際の郵便番号
医用画像からの腫瘍の良性・悪性の診断
・「入力」は画像
・「出力」は腫瘍が良性かどうか
「教師あり学習」の定義詳細 / 使い方
「教師あり学習」の定義詳細
既知のデータと何かしらのアルゴリズムを用いて、入力データ(画像のRGBや日時、気温などの数値をベクトル化したもの)と出力データ(「犬」「猫」などのカテゴリや降水量などの数値)の関係性(これをモデルと呼ぶ)を獲得し、獲得したモデルによって未知のデータに対する予測が出来るようになるプログラムを実現する
モデルとは?
・入力データと出力データの見えない関係性を、数式やルールなどの簡単な仕組みで近似したもの
学習されたモデル
・どのアルゴリズムを使うかという情報と、データから獲得されたパラメーターとで構成されている
特徴
「入力セット」と「期待されている出力」を分析することで「学習」を行う
・「入力セット」を入力すると、そのアプリケーションが「それまで学習してきたことを基にした出力」を期待する
使い方
ユーザ
・入力データと望ましい出力のペア群をアルゴリズムに与える
アルゴリズム
・入力から望ましい出力を生成する方法を発見する
具体例
スパム分類
・アルゴリズムに多数のメール(入力)と、それらがSPAMであるかどうか(望まれる出力)を与える
→ 新しいメールに対して、アルゴリズムは、それがSPAMかどうかの予測を生成する
2つのフェーズ
2つのフェーズ
学習フェーズ
・既知のデータの入力と出力の関係性を得る
予測フェーズ
・未知の入力データからモデルを通じて予測した出力を得る
分類
・ニューラルネットワーク
・決定木
・サポートベクトルマシン
・ベイジアンフィルタ