ところで、周波数の異なる複数の波が合わさってつくる複雑な波を、その構成要素である単純な波に分解する、という数学テクニックが存在する。それがフーリエ変換だ。
音に限らず、私たちが直接観測できるさまざまな信号は、複数の波の集合として表すことができる。逆にいえば私たちは、観測した信号を理解するために、複雑な波を単純な構成要素に分解する必要があるというわけだ。フーリエ変換は、その周波数分解を可能にしてくれるワザなのだ。
私たちの耳には生まれつきフーリエ変換装置が備わっている、と言ってもよい。
フーリエ変換はひとつの式で定義できるのだが、この式にアレルギー反応を示す人もいるらしい。ここでは、その効果だけをお見せする。
図6上のような複雑な波形が得られたとしよう。これに対してフーリエ変換をおこなうと、図6下のように、振幅・周波数の異なる複数のsin波、cos波に分解される。どんなに複雑な信号を観測しても、それにふくまれる周波数成分を明らかにできる、すぐれたワザである。
また、逆方向の操作も可能である。複数の周波数成分を与えられたとき、それらを合成して複雑な波形をつくるワザを逆フーリエ変換という(図8)。
フーリエ変換と逆フーリエ変換を組み合わせると、より高度なワザを使える。たとえば雑音除去だ。観測された複雑な信号にフーリエ変換をほどこした結果、強度(振幅)の小さな成分がふくまれていることがわかったとしよう。これは雑音(意味のない信号の混ざり物)と判定できる。そこで、雑音と判定された成分を除いて逆フーリエ変換をおこなえば、もとの信号をよりクリアに再現できる。
じつのところ、フーリエ変換と逆フーリエ変換の応用範囲はきわめて広く、現代社会を陰で支える存在といってもいい。
最近では、機械が人間の話し言葉を理解する「音声認識」や、発声したり物まねしたりする「音声合成」の技術が、スマートフォンやスマートスピーカーに実装されている。じつはこれらの技術もフーリエ変換が支えている。
たとえば、複雑な波形をした人の声に対してフーリエ変換をおこない、周波数成分に分解することができるようになった。日本語の「あ」や「い」などの母音をフーリエ変換して周波数成分を調べると、それぞれの母音に特有のピーク(フォルマントという)が特定の周波数に表れる。フォルマントの表れる周波数の組み合わせから、どの母音かを判別することができる。
その逆に、たとえば「あ」がもつフォルマントの組み合わせを特定の周波数で合成すれば、「あ」と聞こえる人工的な音声を合成することができる。この音声合成には、フーリエ変換の逆の操作(複数の単純な波を合成する操作)である逆フーリエ変換が使われる。これが、ボーカロイドなどの合成音声をつくる基本的なしくみだ。
さらには、人の声の聞こえをクリアにする技術として、
などが挙げられる。いずれの技術も、フーリエ変換/逆フーリエ変換が黒子役として陰で大活躍しつつ、支えている。
今回は人間の聴覚からはじめて、音声にかかわるフーリエ変換(と逆フーリエ変換)の活躍ぶりを紹介した。フーリエ変換が活躍するのは音声に関する場面だけではない。現代社会はフーリエ変換に支えられていると言ってもいいくらいだ。そんな「スゴ技」を基礎から学びたい人は、ぜひとも拙著『今日から使えるフーリエ変換 普及版』を手にとってみてほしい。
今日から使えるフーリエ変換 普及版
式の意味を理解し、使いこなす
三谷 政昭 著
複雑な波を単純な波に分解する技術。それは文明を陰から支える技術。1冊で、フーリエ変換の数学的基礎から多彩な実例までを学べる! Amazonはこちら