今さら訊けない「ニューラルネットワークって何ですか?」に答えます

連載3回「AIブームの次にくるもの」
松田 雄馬 プロフィール

だが、このパーセプトロンの重要な点は、リンゴ画像とミカン画像を与えただけで、あとは自動的に、ニューロン間の結合が決定され、リンゴとミカンの差異をニューラルネットワークが「学習」するということにある。

すなわち、パーセプトロンは、リンゴとミカンを(あたかも)勝手に「認識」できるかのように動作できたのだ。そのため、「人工知能」の実現を期待させるには十分な衝撃を世の中に与え、第1次ニューラルネットワークブームを引き起こした。

パーセプトロンを製作するフランク・ローゼンブラット Photo by Getty Images

問題点はいかにして乗り越えられたか

ただ、このパーセプトロンは、以下の3つの問題点を抱えており、これが解決できないことから、第1次ブームは終了することとなった。

 

1 線形分離可能なデータにしか用いることができない
2 特徴を人間が教えなければならない
3 精度を高めるには膨大な数のデータを学習する必要がある

まず1 について。たとえば、リンゴとミカンが非常に似ていて、「さまざまな角度から見ないと」区別ができない場合には、パーセプトロンは使えない、ということである。当時において指摘されたのはこの論点だけであった。

次に2 である。リンゴとミカンを区別するのに、単純に白黒にするのではなく赤の成分に着目するなど、特徴を際立たせるための処理を、事前に人間がやっておく必要があるということである。

そして3 について。数枚の画像を分析しただけでは、ノイズを記憶してしまうかもしれないし、個々の画像の特徴に大きく引きずられてしまう。そのため、99%のような高精度での「認識」を達成するためには、数千から数万の画像を記憶させる必要があると言われており、当時のマシンパワーでは困難であった。

ところが1986年、1 を解決する「誤差逆伝播法(バックプロパゲーション)」という方法が、アメリカの心理学者デビッド・ラメルハートらによって発明された。こうして、第2次ニューラルネットワークブームが引き起こされることとなる。

誤差逆伝播法とは何か。簡単に言うと、入力層と出力層の間に新たな「層」を設け、ニューロン間の結合を「多層」にするということである。これにより、入力されたデータを「さまざまな角度から見る」ことが可能になった。

誤差逆伝播法によって1 が解決されたということは、特徴を人間が教えさえすれば(2 を人間がやれば)、また、膨大なデータを学習させれば(3 を実行すれば)、どんなデータでも区別して「学習」できてしまうということである。このため、多くの研究者が「誤差逆伝播法」を用いたニューラルネットワークの開発に躍起になり、「人工知能の実現は近い」と期待された。

ところが、当時のマシンパワーでは、膨大なデータを多層で学習させることは難しいことがやがて明らかになる。こうして、文字認識などの応用事例は見られたものの、研究としてはすたれてしまった。

しかしながら、近年のマシンパワーの急激な成長により、ニューラルネットワークが再び見直されるようになる。つまり、階層を増やして膨大なデータを高精度で分類する「深層学習」が可能になったので、第3次ニューラルネットワークブームが、今まさに到来しているのだ。