耳の中のカタツムリは自然が生んだ「フーリエ変換装置」だ!

さまざまな音を聞き分ける巧妙なしくみ
三谷 政昭 プロフィール

自然が生み出したフーリエ変換装置

ところで、周波数の異なる複数の波が合わさってつくる複雑な波を、その構成要素である単純な波に分解する、という数学テクニックが存在する。それがフーリエ変換だ。

音に限らず、私たちが直接観測できるさまざまな信号は、複数の波の集合として表すことができる。逆にいえば私たちは、観測した信号を理解するために、複雑な波を単純な構成要素に分解する必要があるというわけだ。フーリエ変換は、その周波数分解を可能にしてくれるワザなのだ。

私たちの耳には生まれつきフーリエ変換装置が備わっている、と言ってもよい。

フーリエ変換はひとつの式で定義できるのだが、この式にアレルギー反応を示す人もいるらしい。ここでは、その効果だけをお見せする。

図6上のような複雑な波形が得られたとしよう。これに対してフーリエ変換をおこなうと、図6下のように、振幅・周波数の異なる複数のsin波、cos波に分解される。どんなに複雑な信号を観測しても、それにふくまれる周波数成分を明らかにできる、すぐれたワザである。

【図】複雑な波形を分解
  図6 複雑な波形をsin波、cos波に分解(わかりやすく、大中小の3波で示した)
【図】周波数成分も分かる
  図7 さらに、周波数成分もわかる!

また、逆方向の操作も可能である。複数の周波数成分を与えられたとき、それらを合成して複雑な波形をつくるワザを逆フーリエ変換という(図8)。

【図】フーリエ変換と逆フーリエ変換
  図8 フーリエ変換と逆フーリエ変換

フーリエ変換と逆フーリエ変換を組み合わせると、より高度なワザを使える。たとえば雑音除去だ。観測された複雑な信号にフーリエ変換をほどこした結果、強度(振幅)の小さな成分がふくまれていることがわかったとしよう。これは雑音(意味のない信号の混ざり物)と判定できる。そこで、雑音と判定された成分を除いて逆フーリエ変換をおこなえば、もとの信号をよりクリアに再現できる。

じつのところ、フーリエ変換と逆フーリエ変換の応用範囲はきわめて広く、現代社会を陰で支える存在といってもいい。

最先端技術を支えるフーリエ変換

最近では、機械が人間の話し言葉を理解する「音声認識」や、発声したり物まねしたりする「音声合成」の技術が、スマートフォンやスマートスピーカーに実装されている。じつはこれらの技術もフーリエ変換が支えている。

たとえば、複雑な波形をした人の声に対してフーリエ変換をおこない、周波数成分に分解することができるようになった。日本語の「あ」や「い」などの母音をフーリエ変換して周波数成分を調べると、それぞれの母音に特有のピーク(フォルマントという)が特定の周波数に表れる。フォルマントの表れる周波数の組み合わせから、どの母音かを判別することができる。

その逆に、たとえば「あ」がもつフォルマントの組み合わせを特定の周波数で合成すれば、「あ」と聞こえる人工的な音声を合成することができる。この音声合成には、フーリエ変換の逆の操作(複数の単純な波を合成する操作)である逆フーリエ変換が使われる。これが、ボーカロイドなどの合成音声をつくる基本的なしくみだ。

さらには、人の声の聞こえをクリアにする技術として、

  • 外界ノイズ・キャンセラ機能付きヘッドホン
  • 補聴器のカスタマイズ(個人にフィットした音の聞こえを改善)
  • エコー・キャンセラ機能付き携帯電話(聞きづらさの改善)

などが挙げられる。いずれの技術も、フーリエ変換/逆フーリエ変換が黒子役として陰で大活躍しつつ、支えている。

今回は人間の聴覚からはじめて、音声にかかわるフーリエ変換(と逆フーリエ変換)の活躍ぶりを紹介した。フーリエ変換が活躍するのは音声に関する場面だけではない。現代社会はフーリエ変換に支えられていると言ってもいいくらいだ。そんな「スゴ技」を基礎から学びたい人は、ぜひとも拙著『今日から使えるフーリエ変換 普及版』を手にとってみてほしい。

今日から使えるフーリエ変換 普及版 
式の意味を理解し、使いこなす

三谷 政昭 著

複雑な波を単純な波に分解する技術。それは文明を陰から支える技術。1冊で、フーリエ変換の数学的基礎から多彩な実例までを学べる! Amazonはこちら