ディープラーニングってよく聞く言葉だけど、何がすごいかよくわからなかった
最近、よく聞く「機械学習・ディープラーニング」。
ご縁があって仕事で学生さんと会うことも多いんですが、学生さんにどんな研究してますか。と聞いていみると、「機械学習・ディープラーニング」と言う方もすごく多くなってきた印象です。
どことなく馴染みのある言葉になってきたけど、僕自身、それがなんなのか、どうすごいのかがよく分かってなくて気持ち悪かったんですね。
なので、機械学習や統計学の本を買ってみるものの、積み本になりつつあったので、まずはとっつきやすいこの本を読んでみることにしました。
人工知能の歴史とディープラーニング
帯が「イヴの時間」ということもあり、なんとなく気になっていた本でした(笑)
実際に読み終わった今でも、できるだけ平易な内容で書いて下さった本なのだろう。と感じ取れるくらい読みやすく、コンピュータサイエンスを少しかじったことのあるひとであれば、理解もしやすいであろう文体でした。
人工知能の歴史と種類
1950年ごろから現代に至るまで、人工知能には3度のブームがあったと書かれていました。(意訳)
- アルゴリズムによる複雑な数学的な処理が実現する
- 検索・探索などにより、複雑な条件を扱った処理が実現する
- 機械学習により大きなサンプルデータからおおよそ適切な解を導けるようになる
そして、今ディープラーニングが登場し、新たな人工知能へのブレークスルーがやってきたのだと。
1つ目や2つ目は、現代でプログラミングをする人であれば当たり前のように使っているものではありますが、かつての人たちにとっては現代以上にすごい可能性を感じるものだったのが驚きでした。 そして、期待感の膨らみと、現実的な技術の落とし所にがっかりすることも多かったようです。
ディープラーニング
そして、ディープラーニングの凄さも、本を読み進めるうちに納得していけます。
これまでは上記で言う機械学習により、多数の教師データから取り出したい特徴を抽出し、特徴に応じた分類をしていたようです。
たとえば、多数の手書きの「あ」という文字を学習し、「あ」の文字の特徴を取り出し、学習したデータ以外の「あ」の文字を「あ」と認識する。みたいな。
ディープラーニングはその「特徴」を一つの教師データから取り出せるような方法を実現したようです。とりわけ画像処理の分野において。(と本の中ではありましたが、今ではそれ以外のメディアでも対応できているんだろうか)
多数の教師データを入力し、特徴を見出し、とある正解のデータに分類するのが従来の機械学習であれば、ディープラーニングは一つの入力データから特徴を取り出し、同じデータを出力できるようにする。そしてそれを多層に繰り返し、真の特徴を抽出し、それを分類のコアとするようです。
すごい説明がまどろっこしくて、下手くそな気がするので、別の例で説明します。
ディープラーニング、例えるなら
誰かが書いた「あ」という文字が人間にとって「あ」と認識できる特徴をまず取り出します。
この特徴を元に誰かが書いた「あ」を同じように再現することが可能です。
更に、先ほど取り出した特徴の「特徴」を取り出します。
もちろん、この更に取り出された特徴を元に1回目に取り出した特徴を再現することが可能です。
これを何度か繰り返すことにより、真の「あ」の特徴を取り出すことで、分類器(分類するロジック)を作ることが可能になるそうです。
特徴を取り出すには、かなり多くの計算をしなければならないそうですが、一旦取り出した特徴を用いた分類はすごく高速にできるんだとか。
教師データが少なく済むし、分類器として正確なものを用意できるのも納得だし、ディープラーニングが深層学習と言われる所以もぼんやり見えてきました。
ディープラーニングと脳が何かを捉えるとき
人間が何かを覚えるとき、たとえば「りんご」を「りんご」と認識するには、何度もりんごを見て、両親からこれは「りんご」だと教えられ、色味や形、匂いや触った感じの「特徴」から「りんご」を「りんご」として、認識できるようになるようです。
今回書籍で話のあったディープラーニングは、視覚(画像)からのみの特徴を分析するようですが、応用が進めば様々な感覚(センサー)からの入力により、人間のように「りんご」を「りんご」として認識できる日がくるのかもしれない。
そんな未来がやってきそうな感じが本を読み進める程に感じてこられ、わくわくしてくるような一冊でした。
補足
僕が本を1度読んでみての理解なので、深くディープラーニングを理解している方には不適切・誤った表現や理解があるかと思いますが、その時には優しく教えて下さい。
ともあれ、「人工知能は人間を超えるか」おもしろかったです。もう一度読み返したい。