テレワークが可視化した「あの不快感」を解消するエッジAIとは何か

いまだ不完全なAIを徹底活用する方法
西田 宗千佳 プロフィール

キーワードは「エッジ」だ。

じつは、ソフトやサービスを開発する側で学習がおこなわれ、その結果を使って具体的に「推論」する部分だけを各機器に提供することで、より小さな処理能力で素早く処理できるようにしている。

こうした手法を、最近は「エッジAI」とよぶ。

クラウド側でAIのすべてを処理するのではなく、推論部分を機器側で独立して処理させる手法だ。ネット接続に依存しないため、反応が素早いのが特徴で、ネットの「端=エッジ」で処理されることから「エッジAI」とよばれている。パソコンでのバーチャル背景はもちろん、自動運転車での標識や障害物の認識など、幅広く使われている技術だ。

【写真】自動運転「エッジAI」は、パソコンでのバーチャル背景や、自動運転車での標識や障害物の認識などに使われている技術だ photo by gettyimages

スマホのカメラが超高機能化した理由

こうした「推論処理」にも、相応の演算能力を必要とすることに違いはない。処理能力に比較的余裕のある機器の場合、CPUですべて処理してしまってもいいのだが、CPUは汎用なので、個別の推論処理をするには効率が悪い。

そこで最近は、推論処理に特化したしくみを搭載する機器が増えてきた。

その筆頭が、スマートフォンだ。最近のスマホ用プロセッサーには、AIの推論処理を効率的におこなう機能が搭載されている。ハイエンドスマホのカメラ機能はきわめて優秀だが、それを支えているのが、まさにこの機能だ。エッジAIを使い、カメラが取り込んだ映像を処理し、より「好ましい写真」へと変換しているのである。

パソコンやサーバーでは、従来は3Dグラフィック処理に多用していた「GPU」を活用している。GPUの回路は、推論処理に使うものに特性が似ているためだ。

GPU製造大手のNVIDIAは、同社のGPUを搭載した高性能パソコン向けに「RTX Voice」というノイズ除去ソフトを無償提供している。そのしくみは、前述の「Krisp」などと同じだが、ゲームなどに使うGPUを、ビデオ会議やゲーム実況など、「音声の品質を上げたい」ときにも活用するという発想から生まれたものだ。

「視線」も補正できます

パソコン用のCPUにも、「推論処理」向けの回路が搭載されるようになってきた。インテルの現行CPUである「第10世代Coreプロセッサー」にも、その機能が備わっている。

前出の「Krisp」や「Clear Edge」は、CPU内のその機能を活かすように設計されている。そのため、第10世代Coreプロセッサーで動かした場合には、CPUの処理負荷がより小さくなり、バッテリー動作時間が長くなったり、本体の発熱が小さくなったりする効果が生まれる。

クアルコムがスマホ用プロセッサー「Snapdragon」を応用し、パソコン用に開発した「Snapdragon 8cx」にも、同様に推論処理を効率化する機能が備わっている。それを活かして実現されているのが、ビデオ会議での「視線の補正」だ。

そう、AIが自動で、「瞳の向きをカメラに合わせてくれる」のである。