テレワークが可視化した「あの不快感」を解消するエッジAIとは何か

いまだ不完全なAIを徹底活用する方法
西田 宗千佳 プロフィール

パソコンのカメラは、ディスプレイの上方についているのが一般的であるため、画面上の相手と視線を合わせようとしてもうまくいかないことが多い。そこで、目の位置を機械学習で認識したうえで、「瞳の見ている方向をカメラの方向に合わせて少し補正する」機能を用意して、テレビ会議における違和感を軽減しようというわけだ。

この機能は、マイクロソフトが発売している、クアルコムと共同開発したパソコン「Surface Pro X」向けに、ソフトウエアアップグレードで提供される予定だ。

【写真】クアルコムの視線補正クアルコムが「Snapdragon 8cx」で実現する視線補正の例。機能をオンにした映像(左)と、オフの映像(右)。視線の方向が違うことに注目

「ニーズ」が「機能」を変えていく

カメラを含めた画像処理が一般化し、「プロセッサーの中の推論処理能力」は重要なものになっている。それが、今回のコロナ禍で増えた「テレワーク需要」によって、さらなる変化を遂げた。結果として、ノイズ除去やバーチャル背景、視線補正といった機能に、「エッジAI」として活かされていく。

AIという言葉からは“知的なもの”を思い浮かべがちだが、実際にはそうではない。

今のAIは、文字どおりの意味での「知性」ではないからだ。だが、人間の脳が自然におこなっている「声に集中してノイズを感じにくくする能力」や「シルエットを見分ける能力」を、ある程度再現することで、機械を介したコミュニケーションの不自然さをカバーすることができるようになってきた。

これはまさに、ニーズが機能の活かし方を変えつつある、格好の例といえるのではないだろうか。