Связь объективных характеристик звука и слуховых ощущений

Слуховая система включает структуры и функции организма, осуществляющие преобразование звука в слуховые ощущения. Периферийные отделы слухового анализатора составляют наружное, среднее и внутреннее ухо.

Центральные отделы, связанные с периферийными посредством слуховых нервов, локализованы в соответствующей зоне коры головного мозга. Слуховая система человека является бинауральной, что даёт возможность пространственной локализации – т.е. два раздельных акустических приёмника позволяют системе определять положение источника звука в пространстве. Слуховые ощущения, возникающие в основном под действием звуковых стимулов, как и другие категории психики, трудно поддаются удовлетворительному определению и не могут быть измерены прямыми методами – их связь с объективными характеристиками звука устанавливается в ходе оценочных экспертиз, по мере накопления статистики. Слуховая система имеет множество нелинейных свойств, которые изучает психоакустика с привлечением данных физиологии.

Фундаментальными характеристиками слуховых ощущений можно считать громкость и высоту. Громкость (loudness) – субъективная характеристика интенсивности слуховых ощущений, возникающих при восприятии звука, нелинейно связанная с его объективными параметрами, в первую очередь – со звуковым давлением. Высота (pitch) – специфическое качество слуховых ощущений, коррелирующее с восприятием частоты, доминирующей в спектре звукового сигнала. Само наименование намекает на ассоциацию воспринимаемой частоты звука с его «расположением» на некоторой вертикальной шкале. Значительную роль здесь играет тонотопическая организация волосковых клеток на базилярной мембране улитки внутреннего уха – функция спектрального анализа заложена ещё на физиологическом уровне.

Область слухового восприятия ограничена слуховыми порогами. Абсолютный слуховой порог (thresholdofhearing) – минимальный уровень звукового давления на данной частоте, при котором достоверно возникает слуховое ощущение. Этот порог зависит от индивидуальных физиологических особенностей и условий проведения измерений, поэтому процедуры определения слуховых порогов стандартизированы: см. ГОСТ Р ИСО 389 и ГОСТ Р ИСО 8253. Далее речь пойдёт не об индивидуальных, а об усреднённых слуховых порогах. Абсолютный слуховой порог на частоте 1 кГц не соответствует звуковому давлению ровно в 20 мкПа – это значение принято в качестве опорного уровня условно, как и границы звукового диапазона частот. Не стоит путать абсолютный слуховой порог и опорный уровень звукового давления. Усреднённый абсолютный слуховой порог на частоте 1 кГц по относительной шкале уровней звукового давления (формулировка парадоксальна, не так ли?) соответствует примерно 3 dB. Наибольшую чувствительность слуховой анализатор имеет на частотах 3-4 кГц благодаря резонансным свойствам слухового прохода. Абсолютный слуховой порог здесь соответствует отрицательным значениям децибельной шкалы. Верхний слуховой порог в малой степени зависит от частоты – это порог болевого ощущения, находящийся в районе 130 dBSPL. Это значит, что звуковое давление на пороге болевых ощущений превосходит опорный уровень в три миллиона раз – динамический диапазон слуховой системы человека огромен, особенно в области средних частот (рис. 1).

Рисунок 1. Область слухового восприятия

Субъективная громкость зависит не только от звукового давления, но и от частоты сигнала. Причём, для разных уровней громкости эта зависимость неодинакова, что отражено в кривых равной громкости (equal-loudnesscontours), которые будут подробно рассмотрены в следующей статье. Кроме того, громкость зависит и от продолжительности звука, включая параметры реверберации. Прогнозирование субъективно ощущаемой громкости комплексных акустических сигналов – достаточно сложная задача ввиду множества нелинейных свойств слуховой системы и повсеместного применения компрессии различной глубины проработки. Вопрос о необходимости контроля за «громкостью» встал особенно остро в связи с многочисленными жалобами потребителей медиаконтента на её резкие перепады при рекламных вставках, а также при переключении программ. Лишь недавно появились рекомендации ITU-R BS.1770 и EBU R 128 с сопутствующими документами, где была введена серия из трёх взвешенных единиц LU (loudness unit) и LUFS с разным временем интеграции, призванных решить эту проблему.

Отметим, что интенсивность ощущения часто оказывается прямо пропорциональна логарифму интенсивности стимула. Это – эмпирический закон психофизиологии Вебера-Фехнера, справедливый не только для слухового, но также для зрительного и тактильного восприятия. Большой динамический диапазон слуха и логарифмическое отношение интенсивностей ощущения и стимула – те причины, по которым в аудио применяется такая единица как децибел. Децибел удобен ещё и тем, что он близок к дифференциальным слуховым порогам по громкости – т.е. его можно условно считать чем-то вроде «кванта громкости». Одна из последующих статей будет целиком посвящена уровням и децибельным шкалам. У аудиоинженеров нет подобной относительной единицы для измерения частоты, но целая серия таких единиц есть в музыке – это музыкальные интервалы. В аудиотехнике наиболее применимым из них стала октава, определяемая частотным соотношением 2:1. Кстати, восприятие частоты также в значительной мере подчинено логарифмическому закону.

Фон – логарифмическая единица для субъективной оценки уровня громкости звука. Оценочное значение в фонах привязано к уровню звукового давления чистого тона с частотой 1 кГц: для опорного сигнала с частотой 1 кГц значения уровня громкости в фонах равны значениям уровня звукового давления в децибелах, а звуковое давление равногромких тонов разной частоты отличается. Исходя из вышесказанного стоит заметить, что абсолютный слуховой порог не соответствует уровню громкости в ноль фон. Существует ещё одна единица для оценки громкости – сон: для чистого тона с частотой 1 кГц один сон соответствует 40 фонам, два сона – 50 фонам, четыре сона – 60 фонам и так далее. Есть соответствующая единица и для оценки высоты звука – мел. 1000 мел соответствуют чистому тону с частотой 1 кГц и уровнем звукового давления 40 dB (в некоторых источниках – 60 dB). Высота возрастает с повышением частоты, но если в НЧ-области эта зависимость ярко выражена, то в области высоких частот она гораздо слабее. В некоторой степени высота зависит и от звукового давления, причём на высоких частотах эта зависимость прямо пропорциональна, в то время как на низких частотах – наоборот.

Таблица 1. Связь объективных характеристик звука и слуховых ощущений

Единицы оценки Субъективные характеристики слуховых ощущений Объективные характеристики звука Единицы измерения
Фон / Сон Громкость Звуковое давление Па / dBSPL
Мел Высота Фундаментальная частота Гц
Тембр «Инварианты сонограммы»
Фазовый сдвиг мс / º

Инвариантный характер временно́го распределения спектрального состава звукового сигнала, находящийся в соответствии с динамикой формы волны, явно коррелирует также с тембром как особым качеством слуховых ощущений. Тембр в значительной степени зависит от соотношения временны́х огибающих основного тона и обертонов, а также от обертонового состава в целом. Музыканты обычно определяют тембр как специфическую окраску звучания, присущую тому или иному инструменту ввиду его конструктивных особенностей. Определённый тембр вызывает у человека некоторые ассоциации, что по сути близко к синестезии – поэтому композиторы осознанно используют эту особенность в качестве средства музыкальной выразительности. Сильная сторона электронной музыки заключается в полной свободе манипуляции тембрами. Тембр – многомерное качество слуховых ощущений, которое невозможно оценить в рамках какой-то единственной шкалы, поэтому обычно его характеризуют сразу несколькими эпитетами.

Фазовый сдвиг звукового сигнала как единого целого, сам по себе, никак не влияет на слуховые ощущения. Проблема восприятия неравномерности фазочастотной характеристики будет рассмотрена в специальной статье об акустических системах.

Агалаков Иван