普段は気に留めないことですが、自分が興味を持つ音(例えば友人や家族の声など)が最優先に聞こえる経験は、振り返れば誰にもあるはずです。鼓膜に届いた音波が無意識に取捨選択され、必要な部分だけが抽出されて「音」として聴こえているのです。このように、私達は耳に届いた「空気の振動」から必要な情報をとりだしたり、記憶と関連づけたりしながら、脳がリアルタイムの情報処理を行い「音波を再構成」して「音」として聞いています。
聴覚は測定器のようにすべての音を公平(フラット)にとらえているのではなく、耳は個性にあふれ、合理的で利己的な選り好みをしながら「聞く音」と「聞かない音」をハッキリと区別しているのです。当然、百人の人がいれば「百の聴覚」は一つとして同じ特性ではなく、また同一人物であっても時間と共に耳の特性は刻一刻と変化しているのを忘れないでください。自分に聞こえる「音」が、同じように人に聞こえているわけではありませんし、聴き比べを行うときにも、同じ音が思いこみによりまったく違う音に聞こえてしまうのです。音楽を聴くときにも、この「選り好み」を体験できます。例えば、ギターの弾き語りを聴いているとき「ギター」の音だけを「抽出」して聞くことは、私達にはとても簡単です。しかし、相当高度な音響用コンピューターを使っても、リアルタイムに「ギター」の音だけを取り出すことは出来ないのです。
オーディオの再生音の混濁感を改善し、分解能や空間の透明度、広がりなどを改善しようと試みるときには、この「選り好み」あるいは「抽出」という、人間の聴覚に与えられた生体システム(脳の働き)を考慮することが大切です。「混濁」して聞こえるということは、裏を返せば「特定の音だけを抽出しにくい状態」なので、「透明度を増す」ためには、「音を分離して聞き取りにくい場面」を考え、それを改善すればよいのです。でたらめに試行錯誤を繰り返し時間と金銭を浪費する前に、「ギター」と「歌声」をいとも簡単に分離できる私達の優れた聴覚がどういう障害により「音を分離できなくなってしまう」のか、その理由を見いだし対処法を論理的に解明すれば、より早く良い音というゴールにたどり着くことができるでしょう。
人がたくさんいる「ホール」では、特定の人の話し声だけを聞き取りにくいものです。ここに「大きなヒント」があります。「類似する音は分離して聞き取ることが難しい」という点と「響き(残響)が多い環境では音を分離しづらい」という2点です。しかし、同様に残響の多いコンサートホールでも、腕のいい交響楽団の音は「透明に分離」して聞こえています。それは高度な技術を駆使して「作りだされた結果」であって、誰でもがそのように演奏出来るわけではありませんが、この「実演」とオーディオによる「再演」には、音響的に非常に密接した関係があり、その関係を解明できれば「自室」を「コンサートホール」に変えることが可能となるのです。
「透明に分離したエコー」は一体どういうものなのか考えてみましょう。「オーケストラの生演奏」を聴いているときにも、たくさんのバイオリンの音の中から「特定の奏者の音だけ」を聞き分けることはとても難しいことです。しかし、たくさんの音の中からでもトライアングルの音はハッキリ聞こえます。「異質の音」は「分離して聞こえる」からです。つまり同種・同質の音の重なりは分離しづらくエコーを濁らせるのです。では、私達は一体どのような音を「同質」だと感じ、どのような場合に「異質」だと感じているのでしょう。
人間が音をとらえるメカニズムを少し分析してみましょう。私達の耳には「有毛細胞」と呼ばれる毛の生えた組織があり、鼓膜を振動させた音波は「特定の有毛細胞の毛」を共鳴させるように振動させます。つまり、私達の耳は「色々な周波数に対応した音叉」の集合体のようなものなのです。たくさんの音が耳に入ったとき、音は瞬時に周波数別の振動エネルギーの分布に分解され、この周波数別の振動エネルギーの「分布の状態(パターン)」が類似している音を、私達は「音色が似ている」と感じ、そうでないなら「異質な音」と感じているのです。皮膚感覚にたとえるなら、腕の皮膚に2本の指を1cm程度離して軽く叩いても1本の指の刺激と区別できず「二つの刺激」として感じ取れないのに、指の間隔を20cm程度離して同じ刺激を与えれば、明らかに「二つの刺激」として感じられます。しかし、指の間隔が非常に近くても叩くタイミングが違えば(刺激に時間差があれば)「二つの刺激」として感じられます。同じことが耳の中で起こっていると考えれば分かりやすいと思います。
音に話を戻しましょう。つまり、音が一斉に耳に入った場合、周波数が近く音量も同じくらいの音波は分離しづらく、周波数が離れているか音量が違えば分離できるのです。もしくは、近い周波数や同じ音量でも「適度な時間差」があれば分離して聞くことが出来るのです。これが連続するのが「音を聴いている」という状態で、その時、刺激は「刺激(音)のパターン」として記憶されます。この「音のパータン」の違いに注目しながら聴覚は音を分析しているのです。ですから、同じ声でも「周波数分布のパターン」の異なる「男性」・「女性」・「子供」の声を難なく区別できるのです。声に関わらず楽器でも、指揮者のすぐ側にいるバイオリニスト(コンサートマスター)の「バイオリンの音」が背後の大勢のバイオリニストの音に混ざらず聞きとれるのも、同じように「周波数分布のパターン(倍音構造)」の違いによるのです。
本題のオーディオの音質改善に話を進めましょう。響きを分離しづらくする原因は、「同種の音=似ているパターンを持つ音」だということが分かりました。つまり、機器内部やリスニングルームで音が反射したり、遅延して生じる「再生された音と近似する音響パターンを持つ響き」が音を濁らせる最も大きな原因だったのです。この再生音から生じるエコーによる音質劣化を「エコー歪み」と名付けましょう。エコー歪みはカラオケでエコーをかけすぎると言葉がまったく判別できなくなると同じですが、オーディオ機器の内部やリスニングルームでは、測定器では測れないほどの微少レベルの「エコー歪み」の発生が音を濁らせているのです。