電力供給も食材廃棄も解決!「最適化問題」に「最適な解」を導く方法

人間だけで「本当の最適化」はできない

時間帯、天候、来店客数予測などの組み合わせを加味して最適化することで、売れるぶんだけのおにぎりを入荷することができ、売れ残って廃棄することはなくなる。

最適化問題を、「最適」な手法で解決

GRIDでは、最適化問題の解決をするとき、現実を模擬するシミュレーター(デジタルツイン)に対し、複数の最適化手法でモデル構築を実施する。

手法は、MILPやヒューリスティックといった手法に加え、遺伝的アルゴリズム、深層強化学習を使う。

複数の手法でアプローチするのには理由がある。

「最適化問題を解くうえで、問題や課題に適した手法を選ぶのが効率いいからです。特定の手法だけで解こうとすると、どうしても限界や妥協があります。

これでは良い答えにたどり着きません。そのため、企業様が抱えるそれぞれの課題を解決するために、さまざまなアプローチで最適化を図ります」

加えて、曽我部氏は深層強化学習を使った最適化手法のメリットも教えてくれた。

 

「旧来の手法だと、状況が変わるごとに最適化計算を再度実行していました。しかし、強化学習なら状況が変化した際でも即座に対応できるのが特長です。

たとえば、旧来手法では最適化問題を解くのに3分必要だとします。3分前の問題に対しては解決策を打てますが、旧来手法で解き切ったタイミングで発生してしまった状況には適合しない可能性もあるわけです。その反面、強化学習なら即座に答えを導けるため、リアルタイムで最適化させることができます」

GRIDが主に取り組んでいる最適化事例のなかに「電力システム」がある。

Photo by Getty Images

電力システムの状況はリアルタイムで変化する。そのため、瞬時に答えを出すことが求められるそうだ。中長期的で激しい変化がない事例であれば旧来手法でも解決できるが、動的に状況が変わることに対しては強化学習が有効だという。

強化学習と最適化問題の相性の良さ

そもそも、GRIDはなぜ、最適化問題を強化学習で解決しようとしたのだろうか。

曽我部氏は多くの人がAIについて期待している事は、「『未来がどうなるのかを予測してくれて、その時にどうすれば一番良いのかを教えてくれること』ではないか」と言う。

あわせて、次のように述べた。

「強化学習のいいところは、AIが“望ましい”とされる回答や行動をしたときに『報酬』を与えられる点です。つまり、100%のベストな回答ではなくても、一定基準を超す“良い結果”を出したときにも報酬を与えられるのです。この“曖昧さ”は最適化問題を解く時に非常に有効です」

「最適化問題は現状よりも良い状況にするためのものですが、予測については予測数値が当たるか否かで判断されます」

「イベント会場を運営する人になったつもりで考えてみてください。1万人が来場すると予想を立てたものの、結果的には9900人しか来場しなかった。これは予測の世界では“ハズレ”になりますが、過去1万人を集客するのに必要な広告費用を最適化して削減できる、と最適化の世界では“よし”とされます」