スタンフォードのAIの授業を受けてみました。

カイトです。今回はスタンフォード大学のAndrew Ng(アンドリュー・ング)先生の「Machine Learning」と言うコースを受けてた感想を書きます。

1.「Machine Learning」とは何か?

まず最初に「Machine Learning」とは何かについての定義を説明してくれています。コース中では2つの定義が紹介されていました。

「Machine Learning」の定義①:コンピュータに明示的にプログラムをすることなく学習する能力を与える研究分野byアーサー・サミュエル

「Machine Learning」の定義②:コンピュータ・プログラムは、ある課題Tについてある性能基準Pに基づき、もしTについての性能が基準Pで測定して、経験Eと共に改善している場合に、経験Eから学習したと言うことができる。byトム・ミッチェル

それぞれ見ていきましょう。

定義①コンピュータに明示的にプログラムをすることなく学習する能力を与える研究分野

これはボードゲームのコンピュータソフトを考えていただけると分かりやすいです。ボードゲームにはこういう駒の配置だと勝ちやすいと言うパターンがあります。例えば将棋で言えば、王将の1マス横に金がいる場合は良い形とされています。このようにどの駒の配置のパターンが良いかというのを学んでいくことでボードゲームは上達していきます。ちなみにアーサー・サミュエルはチャッカーのコンピュータソフトを作成しました。アーサー自身はそんなにチェッカーがうまくなかったようですが、彼はソフトに何万回も対局をさせました。(ソフトは根気強いのです。)その結果ソフトはどのような配置だと勝つ傾向にあり、どのような配置だと負ける傾向にあるかを学んで、最終的にはソフトがチェッカーというゲームのパターンを極めきり、製作者のアーサーよりも遥かに上手いプレイヤーになりました。

定義②コンピュータ・プログラムは、ある課題Tについてある性能基準Pに基づき、もしTについての性能が基準Pで測定して、経験Eと共に改善している場合に、経験Eから学習したと言うことができる。

この定義は分かりにくいですね。Andrew先生も「これはただ韻を踏みたかっただけなのではないか」と言っています笑 とはいえ、分かりにくいと言っても仕方ないので、説明していきます。定義②に出てくる課題T、性能基準P、経験Eを先ほどの①チェッカーゲームと②電子メールのスパムメールの選別で例えてみましょう。

チェッカーゲームの場合

課題T・・・チェッカーのプレイ

性能基準P・・・新たな対戦者に対して次のチェッカーのゲームで勝つ確率

経験E・・・数万回もプログラムにチェッカーの対局を自己対戦によって行わせた経験

電子メールのスパムメール選別の場合

課題T・・・電子メールをスパムと非スパムに仕分けさせる

性能基準P・・・正しく分類された電子メールの比率

経験E・・・ユーザーがスパムと非スパムにラベル分けするのを見る経験

このように、課題はそのタスクで行われていること(チャッカーならチェッカーのプレイ、電子メールのスパム選別ならスパムと非スパムの選別)性能基準はそのタスクがどのくらい上手く行えているかを示す数字。経験は性能基準を上げるために行っている訓練と理解すれば良いでしょう。

性能を上げるために、沢山経験を積んで課題Tを解くための能力を上げていくのです。

2.教師あり学習と教師なし学習について

Machine Learningには大きく分けて2つの潮流があります。教師あり学習と教師なし学習です。それぞれの概要を見ていきましょう。

教師あり学習・・・コンピューターに人間が何かするやり方を教える

教師なし学習・・・コンピュータが自分で学ぶのに任せる

最近では教師なし学習の方が主流になってきています。人間が逐一やり方を教えるのは大変なので。例えば将棋の世界では2000年前半までは教師あり学習が主流でした。将棋ソフトを強くする際に飛車をとったら10点加点とか王将の周りに金や銀がいたら加点など、人間の知識をひたすら将棋ソフトに入力していきました。このやり方だとアマ五段くらいで実力向上がストップしてしまいました。理由は開発者の人間が手取り足取り教えるため、開発者より強いソフトは作れないからです。加えて、いくら人間が教え込んでも将棋の指し手の可能性は膨大なので教えきれないという問題がありました。

それを打破したのが教師なし学習です。将棋の世界では将棋の初心者の保木さんという方が開発したBonanzaというソフトが2006年にコンピュータ将棋選手権で初出場初優勝を果たしました。Bonanzaは人間が将棋のパターンを教え込むのではなく、コンピュータ自身の自己対戦によって強くなったソフトです。まあ「自分で教えられないからコンピュータパワーで押し切っちゃえ」というブルドーザーみたいなやり方ですがこれが当たりました。職人技が必要な教師あり学習、コンピュータの計算力で押し切る教師なし学習といったイメージだと思います。

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

カテゴリーから探す

最近の記事

  1. 2019.08.26

    5手詰 365問
  2. 2019.08.26

    3手詰 365問
  3. 2019.08.26

    1手詰 365問
  4. 2019.08.25

    5手詰 364問
  5. 2019.08.25

    3手詰 364問
PAGE TOP