説明
Bはでたらめなメロディーですが、A、C、D、Eは「きらきら星」のメロディーが聞こえたのではないでしょうか?しかし、D、Eの音にはちょっと 「しかけ」があります。
図1~5は、A~Eそれぞれの音が、どのような周波数成分からできているかを示したものです。横軸は時間(単位: 秒)、縦軸は周波数(単位: Hz)、色の赤いところはパワーが大きい部分(ここではそれぞれの音符を構成する周波数成分に対応)、青いところはパワーが小さい部分、黄色い部分はその中間を表しています(ここでは背景に入れてある「サー」という雑音に対応)。
まず図1から見てみましょう。これはAの音です。赤い横棒がひとつの音符につきひとつずつあって、それがメロディーの上下に対応して変化していますね。このように、ひとつの周波数成分だけからなる音を「純音」といいます(音叉の音がこれです)。純音の場合には、知覚される音の高さ(これをピッチと言います)は単純に周波数の高低に対応します。図2(音B)のように周波数がでたらめに上下すると、メロディーもでたらめになります。
次に図3(音C)をみてみましょう。今度は、それぞれの音符の音が、10個の周波数成分(赤い横棒)からできています。このように、複数の周波数成分からなる音を「複合音」と呼び、一番下の(低い)周波数成分を「基本周波数(ファンダメンタル)」と呼びます。その上の周波数成分は、基本周波数の2倍、3倍、… というように、整数倍になっています。これを「倍音」と呼びます。メロディーを奏でる楽器や歌声のように、はっきりとした高さが知覚される音は、ほとんどの場合たくさんの倍音を含んでいます。基本周波数が上下すると、倍音の周波数もそれに応じて上下します。赤いパターンを見ると、メロディーが浮かんできますね。
さて、問題のDの音です(図4)。音の高さ(ピッチ)は「ドドソソララソ…」と聞こえるのに、周波数成分の上がり下がりはメロディーに対応せず、ばらばらですね。例えば、最初のふたつの「ド」は同じ高さのはずなのに、それらを構成する周波数成分は違います。さらに「ドドソソ」と進むと、メロディーは上がっていますが、周波数成分は下がっています。つまり、一つの音を構成する周波数成分の高低と、知覚される音の高さ(ピッチ)の高低とは、単純に対応しないのです。
図5はEの音です。D(図4)はひとつの音符が5つの周波数成分からできていますが、Eではそれが3つになっています。やはり、Dと同じく、各音符の高さ(ピッチ)とそれを構成する周波数成分は単純に対応していませんね。それでも、「きらきら星」が聞こえるのではないでしょうか(人によっては、メロディーが多少違って聞こえるかもしれません。DやEの音はちょっと特殊なので、周波数成分の数が少ないと、ピッチが曖昧になる可能性がありますが、異常ではありません)。
これはいったいどういうことでしょうか?実はここに、人間が音の高さ(ピッチ)を知覚するメカニズムが隠されています。
さきほど、メロディーを奏でる楽器や歌声のように、はっきりとした高さが知覚される音は、基本周波数成分とその倍音成分を含んでいると述べました。基本周波数は波形の繰り返し周期の逆数で、発音体の長さや重さ、張り具合などによって決まります(ピアノやギターの弦を思い浮かべてみてください)。音の高さ(ピッチ)とは、この基本周波数に対応するものです。ここで重要なのは、「基本周波数成分が物理的に存在していなくても、倍音成分から基本周波数を推定することができる」ということです。例えば、300 Hz、400 Hz、500 Hzの周波数成分が同時に存在していれば、それらは100 Hzのそれぞれ3倍、4倍、5倍の倍音になっているので、基本周波数は100 Hzと考えられるわけです。実際、聴覚系はこのような「基本周波数の推定」を行っていることが、さまざまな実験によって確かめられています。基本周波数およびその倍音を多数含む複合音(例えば音C)から、基本周波数、第2倍音、第3倍音、…と順番に取り除いていっても、音の高さ(ピッチ)は変わりません(音色は変わりますが)。
音D、音Eは、音Aを基本周波数とする倍音の中から、それぞれ5つ、あるいは3つの連続した倍音を(3倍、4倍、5倍、6倍、7倍とか、9倍、10倍、11倍というように)ランダムに選んで作成したものです。こうすると、基本周波数は存在していませんが、残っている周波数成分から、欠落した基本周波数成分(=ミッシング・ファンダメンタル)が推定され、それに対応する高さ(ピッチ)が知覚されるのです。音D、音Eで聞こえた「きらきら星」のメロディーは、このようにして作られたものなのです。
このような機能は、単に奇妙な錯覚というわけではなく、実は日常生活でも大いに役立っています。日常生活では、妨害音や、通信機器の周波数特性などによって、本来含まれているはずの基本周波数成分が失われてしまうことがしばしばあります。例えば電話で話しているとき、声の基本周波数成分は伝送されていませんが、男性の声は女性の声よりも低く感じられますし、イントネーション(声の高低のパターン)もちゃんとわかりますね。これもミッシング・ファンダメンタルを知覚するメカニズムのおかげなのです。
(『音のイリュージョン』p.77-81)
参考文献
- 「音のイリュージョン ― 知覚を生み出す脳の戦略 ―」 柏野牧夫著 岩波書店 2010年
デモについて
- デモの操作方法については、使用方法のページをごらんください。
- 錯聴デモを使用される際には、耳にダメージを与えないよう、お使いのデバイスの音量設定を最適な状態にしてからおためしください。