音の正体
2. 耳の正体
https://scrapbox.io/files/659a17932f5dad0022ee4550.webp
中耳の耳小骨がテコの原理で振動して音を約17倍に増幅する 蝸牛内部の基底膜が振動を電気信号に変換して聴覚神経に送られる
3.5cmの間にある有毛細胞が音を感知する
外耳側が高音、内側が低音を感知
マイクとの共通点
外耳→収音
中耳→変換&増幅
耳に痛い音とは
3-5kHzの周波数成分が強い音
閉管はその長さの4倍の波長の振動を与えられると共鳴が起きて増幅する
20Hz-20kHz
3. 空気振動と波形
デジタルの波形イメージとは異なり、音は縦波。疎密波ともいう 物体が変形して周囲の空気が押し出され、空気が密な箇所ができる。物体が元の形に戻ると疎になる。
この周期により、進行方向に対して前後に振動する
https://gyazo.com/d747deff2e16e381d506ad838d781a19
疎→密→疎の間が1周期
縦波はイメージしにくいため波形として表現される
音響学的には「波形がわかる=周波数分析ができる」なので便利 足し引きや分解が理解しやすくなる
アタック、リリース、音圧の時間変化を可視化しやすい 周波数成分を知ることができる
一定の波形が繰り返し現れる周期性があり、主要な周波数成分が整数倍の関係にある音にはピッチ感がある
最も音圧レベルが高い成分が基音だが、基音がピッチと認識されるには倍音が重要 波形が周期性を持たない
周波数成分のピークが整数倍の関係にない、非整数次倍音成分が強い 非整数次倍音はノイズではあるが音の特徴を決める重要な要素でもある 波形の足し引き
波の干渉原理により、複数の音は強めあったり弱めあったりする 波形の山と山が同じ位置(正相)にあれば増幅、山と谷が重なる位置(逆相)であれば打ち消す ノイズキャンセリング機能は超小型マイクでキャッチした騒音の波形の山と谷をひっくり返した音を再生して騒音を消す 信号線ホットと、逆相の信号線コールドの2本が通っている
正確にはもう一本、信号の基準0V用のグランド線がある
出力時にコールド線の信号を反転させ、途中経路で乗ったノイズを消すために入力機器側で再度コールドを反転させることでノイズをキャンセルする
2個のシングルピックアップのうち1個の信号を反転させている
逆相となるマイクが2つあると打ち消しあってしまう
位相ズレ
1/4のズレ(90度ズレ)などもありうる
強め合う箇所と弱め合う箇所がうまれて独特のうねりがうまれる
フェイザーは位相を変化させた効果音を原音にプラスしている 6. 声の正体
声は1cmほどの声帯と、口腔や鼻腔などの通り道となる声道により生み出される
声帯は音源であり、パイプオルガンや木管楽器のリードに近い
音源を加工するフィルターが声道。ブザー音のような声帯の振動音を声にする
声帯の平均的な振動数は成人男性で約100Hz, 女性で200Hz, 子供で300Hzと低い
音程を決める周波数ピークや倍音構成とは別に、声道の共鳴特性によって特徴的に強調される周波数帯域のこと
フォルマントの構成パターンによって母音が区別して発音される
外国語習得時にはその言語のフォルマントパターンを習得しないといけない
ピッチとフォルマントは独立して形成できる
声の基本周波数や倍音成分が変化してもフォルマントの絶対値は保たれるため
「あ」をA2で発声してもA3で発声してもフォルマントパターンは同じ
EQをいじっても音が良くならないとき、マスターボリュームをあげることで広いレンジを持つ音がしっかり出ることも
基音なしで整数次倍音だけを鳴らしても基音を感じ取ることができる
早いテンポのフレーズの1音とノイズに置き換えても気づかない
存在しない音を補完する
音の3要素である音色・高さ・大きさ
倍音構成やエンヴェロープ形状でのアプローチは物理的な性質に比重を置いて解明するもの
識別的側面
人の声を聞き分けたり、楽器を聞き分けたりできる
音を聞いた時に記憶の中のどの音と一致するのかを照合するパターン認識
音を特徴付ける要素を覚えれば過去には聞いたことない言葉やメロディについても人や楽器を識別できる
印象的側面
美的因子
澄んだ・濁った、綺麗な・汚い
金属性因子
硬い・柔らかい、鋭い・鈍い
迫力因子
迫力ある・物足りない、力強い・弱々しい
16. スタジアム音響
どの場所にいても伝わるよう、分割された各エリアだけに届く指向性を持ったスピーカーやラインアレイをドーム天井に設置している
ステージから離れる後方では減衰するだけでなく音が遅れて聞こえる
そのぶんのディレイタイムをかけた音をステージ後方のディレイスピーカーで鳴らすことで、力強くクリアな音を後方でも聞ける
20Hz前後の空気振動は聞こえるか聞こえないかの境界線上だが、人は音を感じることができる
スピーカーは高域担当のツイーターと低域担当のウーファーを組み合わせたものが一般的
ウーファーの再生できる帯域の下限はモデルにもよるがだいたい50Hz
エントリーモデルでは60-80Hz、ハイエンドで30-40Hz
重低域はそれより低い20-100Hz付近と考えられる(定義はない)
重低音を鳴らすサブウーファーは必要?
ポップスやロックのベース、キックが生々しくなる
ボーカルの低域成分が補強されて太いハリや艶が出る
チェロやコントラバスの音にも厚みが出る
ティンパニーの音程感が明瞭になる
最低音が16Hzのパイプオルガンの響きがすごい
車の走行音で低域成分がマスキングされやすく、もともと低音が聞こえにくい環境 ライブではサブウーファーをしっかり鳴らすことで、全体の音を下げても迫力をキープできる
コンサート会場の空間の音響特性で音の良さに大きな影響を与えるのが残響時間
ボストンシンフォニーホールを設計した、ハーバード大学の物理学者W.C.セイビンに端を発する
このホールは満席時に残響が2秒になるように設計した
他にも音の悪い講堂の改善のためにカーテンを1つずつ追加するなど
5秒以上の残響時間を持っていたという
日本では大阪のザ・シンフォニーホールが残響2秒で設計されていることで有名
残響とは、音が鳴り止んだ後もその音の響きが聞こえる現象
残響時間の定義は、音が鳴り止んでから60dB減衰するまでの時間
レコーディングスタジオでは0.3-0.5秒、ドームであれば空席時に6-8秒、満席時に約3秒
音のエネルギーが100万分の1になることを意味する
最適な残響時間は目的や空間によって異なる
録音時にはなるべくデッドにする
ホールやライブハウスでは適度な響きが必要だが多すぎるとビート感が不明瞭になったりコード感が濁る
22. 周波数、ピッチ、音程
周波数は物理量
ピッチは感覚量、音の主観的な高さ
周波数成分が異なっても同じ音の高さに聞こえれば同じピッチ
音程は2つ以上の音の相対量
人が2つの音のピッチのズレを感じるのは0.3-0.7%程度の差があるときといわれる
±0.2-0.6%であれば同じピッチと判断する
998-1002Hzの音は1000Hzの音と同じだと感じる
比率なので周波数が小さくなると絶対値のズレにはシビアになる
100Hzでは±0.2Hzしか許容されない
整数次倍音が鳴っている音から基音を抜いても人は基音を感じ取る
このピッチをレジデューピッチという
音の高さに対する感覚は周波数とは比例しない
周波数を3倍にしたときにピッチが2倍になったと感じる
27. ディレイ
人が2つの音と知覚できる限界は1-2ms
一般には30ms
30ms以下のディレイタイムであれば原音が変化したように感じる
80msを超えると分離した別音として聞こえ、響きを感じる
デジタルでディレイ音がまったく原音と同じだと不自然に感じる
ハイを残して減衰することで硬質な壁をイメージさせたり
ハイカットしてフィードバックを少なくすると適度なルーム感を出せる
29. 多チャンネルサウンド
世界中の音楽再生システムの基本はステレオ
さらにスピーカーを増やしたシステムをサラウンドという
通常のステレオは前方にLRがある
5.1chの推奨セッティングでは後方にサラウンドLRを追加し、センターとサブウーファーを前方中央に置く
媒体ごとの違い
CDは2chオーディオ
DVDは5.1chを収録できる
Blu-rayは7.1chを収録できる
映画館では7.1chが標準
家庭で5.1や7.1のサラウンドを再生するのは難しいためサラウンド音声を2ch音声化する仕組みが開発された
人間の聴覚特性を利用した信号処理で後方のスピーカーから鳴っているように錯聴する
天井含めて64個のスピーカーを鳴らすシステム
音を位置情報とともに記録するオブジェクトベース概念が導入されており、9.1chとオブジェクトの組み合わせで最大128の音響要素を再生できる
通常のステレオ録音でサラウンドに近い表現ができる
楽器の音色は倍音構成と波形によってほとんど決まる
ヴァイオリンや金管楽器の波形はノコギリ波に近い
基音と整数倍のサイン波に分解できる
クラリネットの波形は矩形波に近い
基音と奇数倍のサイン波に分解できる
その他にも強いピーク音やノイズなどが影響する
歪みの仕組み
電気・電子回路の電気的な特性として、回路内で正常に信号(波形)を送れる限界レベル(電圧)が決まっている
限界を超えると飛び出た部分が強制的に潰れた波形になり、これをクリップという
あらゆる波形は複数のサイン波に分解できる。クリップして潰れた部分のサイン波がサイン波でなくなると新たなサイン波の集合=倍音が生まれる
ギター本来の音は倍音の少ない薄い音だが歪みによってアタック時間が伸び、これにより音が太く増強される
歪みのキャラクター
エフェクターによって波形の潰れ方は多種多様
ゆるい潰れは三角波に近似し、基音と偶数倍音が多い
基音に対してオクターブの関係にあるので音の厚みや心地よさが増す
変形はノコギリ波に近似し、基音と偶数倍音・奇数倍音が多い
激しい潰れは矩形波に近似し、基音と奇数倍音が多い
奇数倍音は一般的には不快な音になりやすいが基音の3倍はオクターブ+完全5度上、5倍は2オクターブ+長3度の関係になるので音色の幅が広がる
シンセサイザーの音作りでは基音と、奇数倍音のみの矩形波にフィルターをかけていく ハモンドオルガンは1つのキーを押したときに最高9個のトーンホイールの音を鳴らすことができる
それぞれのトーンホイールの音を鳴らす・鳴らさない、またどのくらいの大きさで鳴らすかを調整するためのスライドボリュームをドローバーと呼ぶ