Photo by Pixabay

実在しないアイドル画像も瞬時に生成するAI「GAN」が賢すぎる!

「敵対的生成ネットワーク」のしくみ
近年ホットなディープラーニング。なかでも注目されている技術のトレンドの1つが、「敵対的生成ネットワーク」(Generative Adversarial Networks。以下、GAN)です。GANは「機械学習において、この10年間でもっともおもしろいアイデア」と言われるほど、研究はもちろん実用レベルでも注目されている手法です。この記事ではGANについてわかりやすく解説しながら、GANで何ができるのかを具体的に紹介していきます。

実在しないデータを生成する

ディープラーニングの技術は日進月歩で進化しており、新たな研究が発表されると、すぐに実装コードが公開されたり、応用研究が進められたり、ビジネスに適用されたりします。

なかでも最近注目されている技術の1つが、「敵対的生成ネットワーク」(Generative Adversarial Networks。以下、GAN)です。GANは生成モデルの一種であり、データから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換できます。

GANはそのアーキテクチャの柔軟性から、アイデア次第で広範な領域に摘用できます。応用研究や理論的研究も急速に進んでおり、今後の発展が大いに期待されています。

現在、GANは文化の領域でもちょっとした話題になっています。AIによって制作された芸術作品として初めて競売された作品に関わっていたり、「ディープフェイク」と呼ばれる一連のフェイク画像や動画の背後にも存在したりしています。

まずは、GANが生成した画像データの一例を見ていきましょう。

●実際には存在しないアイドルの顔を生成

●手書きの線画から本物のように着色

GAN

●写真をアニメキャラクターに変更

GAN(敵対的生成ネットワーク)

探偵と怪盗が競うから「敵対的」

GANは、『ディープラーニング』(邦訳『深層学習』)の著者でもあるイアン・グッドフェロー氏が考案したモデルで、いわゆる「教師なし学習(unsupervised learning)」の一つの手法です。

これは、学習対象のデータはあるものの、それが何かという正解は与えられておらず、どうにかして何かしらの構造や法則を見いだすというもの。あたかも写真のようにリアルな画像の生成が可能であり、画像処理や情報可視化の分野で注目されています。

「敵対的」とあるように、普通のディープラーニングのネットワークと異なり、GANには「ジェネレーター(generator)」と「ディスクリミネイター(discriminator)」という2つのネットワークが登場します。

ジェネレーターは本物と同じような内容を作り出そうとする一方、ディスクリミネイターはレプリカか本物なのかどうかを識別する役割を担っています。ジェネレーター側は怪盗、ディスクリミネイター側は探偵、にたとえるとしっくりきます。

レプリカを作る側は本物にできるだけ近づけようと努力し、対して識別する側は確実に見分けられるように、互いに競い合う仕組みとなっています。