これだけは読んでおきたい! 機械学習を学ぶ人のための厳選入門書

その先のへ進むために

大量のデータをもとに自動的に反復学習する「機械学習」。近年、飛躍的な進歩を遂げている最新理論の基本的な概念と代表的な手法を難解な数式を使わず、中学生でもわかる平易な記述で解説することを目指したブルーバックス『はじめての機械学習』は、これから勉強を始める学生、機械学習について知りたいビジネスパーソン必読の書となりました。

しかし、数式にうとい人にもわかりやすく、という命題を最優先したために、執筆は「正確性に欠ける」という悩ましいジレンマとの闘いだったと著者は言います。

そこで、本当に機械学習のさわりである本書で入門した読者の"その後"ために、「もっと知りたい」「本格的に学びたい」と思った時に、どんな本が参考になるのか? 「読者に欲求不満がたまるのではないか」と案じた著者が、"その先の道標"を紹介しつつ、学ぶべきポイントを説きます。

もっと知りたい

ブルーバックスより刊行された『はじめての機械学習』(以下、本書とする)は、おかげさまで好評をいただいたが、この本では、本当に数学をなるべく使わないで説明することに注力した。正直言って機械学習まわりで極力数学を使わないで説明しようという態度の本はあまりない。

それは1つには機械学習は、物理学や数学や生物学みたいな科学、というより何かをするための道具だからだ。道具であるからには使えるようにならなくてはいけない。ゴルフがうまくなるにはどうすればいいか、について書かれた本はたくさんあっても、ゴルフ自体について書かれた本なんてほとんど見かけないのと同じことだ。

もう1つはとにかく、数式を使わないで機械学習の説明をするのがとても難しいからだ(お前はやってるじゃないかと言われたらそれっきりだが、そもそも、そんなことに挑戦すること自体が無謀である)。

それでも数式を(あまり)使わない機械学習の本がまったくないわけではない。いくつかあげてみよう。

伊庭幸人「岩波講座 物理の世界 物理と情報〈3〉ベイズ統計と統計物理」(岩波書店)2003年

amazonはこちら

20年近く前の本だし「物理」と書いてあるからなんか違うんじゃないかと思う人も多いかもしれないが、れっきとした機械学習の入門書であり、名著とされている。

本書では何度も「確率最大にする=もっとも起きやすいことが起きている」という考え方で機械学習の答えを出す、という話を述べてきたが、なぜ、それでいいのか、という話はほぼなかった。

ベイズ統計学、というのはある意味、何かを確率最大で求めることの意味や、どうやってそれを実行するか、という学問であり、深層学習がブイブイ言わせるようになるまでは、すべての機械学習の基本になるような考え方だった。

その意味でこの「ベイズ統計と統計物理」という本は、そもそも機械学習というものの裏にどんな哲学が隠されているかを考えるという意味では、実によく書かれている。騙(だま)されたと思って手にとることをお勧めする。きっと損はしない。

今泉允聡「深層学習の原理に迫る:数学の挑戦(岩波科学ライブラリー303)」(岩波書店)2021年

amazonはこちら

打って変わって最近出たばかりの本だ。著者の今泉先生は「なんで深層学習がこんなに性能がいいのか?」ということを、理論的に解明する仕事をしている新進気鋭の若手の科学者である。その説明がわかりやすいことは衆目の認めるところであり、初のご著書ではあるものの、なんで深層学習がここまでぶっちぎりにすごい性能を持つのか、について、どんな研究がされているかを説明してくれている。必ずやみなさんのご期待にそえることだろう。

東中竜一郎「AIの雑談力」(角川新書)2021年

amazonはこちら

本書ではさらっとしか触れられなかったBERT*と東ロボ**の関わりとその後の発展などについて書かれた良書。式などは基本用いられていないので気軽に読める。こっち方向のプロ研究者の方の執筆なので、内容に偽りなし。

*BERT:Googleが2018年に発表した言語処理モデル。それまでの機械学習を上回る高い精度を示した。

**東ロボ:国立情報学研究所が2011年度に始めた「ロボットは東大に入れるか」という目標を掲げたプロジェクト。「(それまでに)蓄積された人工知能の各要素技術の精度を高め、情報技術分野の未来価値創成につなげる」ことを目的としている。

RAD-IT21(https://rad-it21.com/

本ではないのだが、AIに関係する論考を集めたWEBマガジン。いくつか機械学習に関係した記事をピックアップしておく。

【画像】RAID-IT21トップページRAID-IT21

など。他にも興味深い記事がアップされている。

関連記事