Психоакустика

Ирина Алдошина


В статье известного российского ученого-акустика Ирины Аркадьевны Алдошиной представлен обзор докладов на конгрессах AES (Audio Engineering society, рус. Международное общество аудиоинженеров), а также другой литературы, посвящённых звуку с высоким разрешением. И.А. Алдошина — профессор, доктор технических наук, заслуженный деятель науки РФ, член Координационного Совета по акустике РАН, председатель Санкт-Петербургского отдела AES, автор более двухсот научных трудов.
Приведены отрывки из статьи. Полный текст – в журнале «Звукорежиссёр» № 4 за 2004 год.

«Суть вопроса заключается в следующем: «Зачем постоянно увеличивать частоту дискретизации в современных системах аудиокоммуникаций (тратя на это огромные средства), если пороги слуховой системы ограничены по частоте диапазоном 20 Гц…20 кГц?»

Попытки ответить на этот вопрос предпринимались многократно, однако однозначного ответа до сих пор нет.

В. Войчик является профессором Университета McGill в Канаде (крупнейшего мирового центра исследований в области психоакустики) и председателем технического комитета AES, поэтому в его распоряжении имеются практически все основные результаты работ, позволяющие в той или иной степени ответить на этот вопрос.

Анализ этих результатов, а также другие соображения, содержащиеся в литературе, и будут представлены в данной статье.

На протяжении почти столетней истории развития технологий звукозаписи главной их целью было нахождение методов сохранения и воспроизведения исполняемой музыки со всеми тончайшими акустическими деталями и максимальной точностью, необходимой для ее восприятия. Термин «натуральность» (который является главной целью создания аппаратуры Hi-Fi) символизирует множество присущих звукозаписи характеристик, которые обеспечивают полное ощущение погружения в музыку с учетом окружающей среды, то есть акустики зала. Такие записи должны обеспечивать восприятие детального взаимодействия между инструментами и исполнителями и реализм в ощущении времени и пространства, то есть чувство нахождения в том акустическом пространстве, где исполняется музыка. Современные цифровые записи с высоким разрешением (высокой частотой дискретизации и большой разрядностью квантования) и стремятся обеспечить слушателей возможностью восприятия большого динамического диапазона, точностью передачи быстрых изменений звука во времени и по другим показателям, то есть точностью передачи деталей пространственно-временно-спектральной структуры музыки.

Чтобы оценить сложность этой задачи, достаточно представить себе, какие процессы происходят в концертном зале или студии при исполнении оркестром какого-либо музыкального произведения, когда инструменты из различных мест сцены вступают во взаимодействие с акустическими свойствами помещения, находясь при этом во взаимодействии друг с другом. Способность слуховой системы услышать каждый инструмент на его реальном месте, оценить перспективу и влияние помещения с учетом быстрого изменения всех этих взаимодействий во времени зависит, прежде всего, от уникальных возможностей слухового аппарата. Однако при передаче всей пространственной картины ее восприятие зависит и от разрешающей способности записывающих, передающих и воспроизводящих систем. <…>

В многочисленных докладах на конгрессах AES и в дискуссиях на заседаниях технического комитета «Аудио с высокой разрешающей способностью» высказывались мнения, что дальнейший прогресс в улучшении «прозрачности» и создании «ощущения присутствия» в системах звукозаписи может быть достигнут за счет увеличения разрешающей способности цифровых систем, то есть увеличения частоты дискретизации, и, следовательно, расширения частотного диапазона передаваемого звука за пределы 20 кГц.

Анализ накопленных знаний по данной проблеме позволяет сказать, что этого недостаточно. Учитывая сложность звукового сигнала и свойства слуховой системы, можно утверждать, что только повышение разрешающей способности передающих систем во всех областях (временной, спектральной, пространственной и динамической) может помочь в решении данной проблемы. По крайней мере, уже сейчас кажется очевидным, что высокая разрешающая способность во временной области является наиболее важной для обеспечения прозрачности звучания.

Рис. 1. Преобразование аналогового сигнала в цифровой

Как известно, для превращения аналогового (непрерывного) сигнала в цифровой (дискретный) необходимо выполнить следующие операции: дискретизацию, квантование и кодирование (рисунок 1). Для их выполнения во всех цифровых устройствах (компьютерах, магнитофонах, проигрывателях и пр.) используется аналого-цифровой преобразователь АЦП (ADC), структурная схема которого показана на рисунке 2. В соответствии с теоремой Котельникова (Найквиста) или «теоремой семплирования», для преобразования аналогового сигнала с верхней частотой fв (Гц) в цифровой без потери информации необходимо, чтобы частота дискретизации, т. е. число отсчетов (семплов в секунду) было не меньше, чем 2 х fв (Гц). Используемое цифровое слово, число двоичных цифр в котором равно числу выбранных M (бит), представляет мгновенное значение входного сигнала, при этом сигнал квантуется на 2M уровней.

Таким образом, теорема семплирования требует, чтобы частота дискретизации была выбрана достаточно высокой fd > 2fв, при этом сигнал должен оставаться почти постоянным в момент семплирования. Обязательность использования низкочастотного фильтра, который стоит во всех АЦП, не оговаривается, но для предотвращения появления лишних частот в спектре во всех цифровых устройствах стоит антиэлайзинговый фильтр, обрезающий сигнал на частоте fd/2.

Рис. 2. Структура АЦП

При постоянно меняющейся временной структуре музыкального сигнала временная точность и высокая скорость семплирования, а также точность квантования являются обязательной основой для передачи субъективных признаков звука, в том числе его прозрачности.

В современных цифровых устройствах используются в настоящее время (и будут использоваться в ближайшем будущем) следующие значения основных параметров:

Для формата DSD-2 (лабораторные испытания) временной интервал между семплами составляет 0,17 мкс.

Одним из основных направлений исследований в современной психоакустике и является вопрос: «Достаточна ли такая скорость отсчетов или нет, и каков необходимый предел ее увеличения?»

Рис. 3. Запись короткого удара барабана конденсаторным микрофоном

Запись сигнала в любой системе начинается с микрофона (рисунок 3), представляющего собой полосовой фильтр, который уже сам обладает определенными фазовыми и переходными искажениями, приводящими к дисперсии и размыванию сигнала во временной области. Данные об этих искажениях редко приводятся в каталогах на микрофоны, однако большой комплекс исследований, выполненный за последние годы, позволил установить значительную разницу по этим параметрам между динамическими и конденсаторными микрофонами. Для конденсаторных микрофонов получены значения атаки в несколько микросекунд, в то же время спад переходных процессов достигает нескольких сотен микросекунд. Была доказана также важность фазовой линейности микрофонов не только внутри, но и за пределами звукового диапазона (в ультразвуковой области) для обеспечения минимального размывания переходных характеристик музыкального входного сигнала.

Затем аналоговый сигнал, подвергающийся преобразованию в цифровой, обрабатывается низкочастотным фильтром на входе АЦП (антиэлайзинговый фильтр). Этот фильтр также служит причиной дисперсии импульсных характеристик входного сигнала за счет неравномерности АЧХ и ФЧХ в полосе пропускания, крутизны кривых спада в переходной полосе и фазовой нелинейности (рисунок 4).

Рис. 4. Частотная характеристика ФНЧ

Такие искажения приводят к временной дисперсии входного сигнала и означают, что каждый мгновенный семпл на выходе будет содержать элементы информации от предыдущих семплов (количество которых зависит от характеристик фильтра). Так как музыкальный сигнал представляет быстро изменяющийся во времени поток с резкими, короткими импульсами, то такая дисперсия и размывание оказывают определенный эффект на слуховое восприятие, особенно для опытного и внимательного слушателя с хорошим музыкальным слухом.

Акустические музыкальные сигналы обладают сверхбыстрой нестационарной временной и динамической структурой, которая обуславливается различными причинами, в частности, быстрой атакой реальных музыкальных инструментов, наличием большого количества ультразвуковых составляющих в спектре многих инструментов, возникновением коротких реверберационных временных задержек в помещении и др. (рисунок 5).

Рис. 5. Временная структура музыкального сигнала (скрипка)

Например, при исполнении форте на трубе звук может достичь пиков 120…130 дБ за 10 мкс, на цимбалах за 7…10 мкс можно получить резкий подъем до 136 дБ. Отсюда следует, что временной интервал семплирования, используемый при записи CD, равный 22,7 мкс явно недостаточен. Чтобы отследить такие быстрые изменения в сигнале, интервал должен быть не больше 1 мкс.

Измерения, выполненные с помощью современной прецизионной аппаратуры (специальные измерительные микрофоны B&K 4135, АЦП с частотой 195 кГц и др.), позволили выявить в спектрах музыкальных инструментов большое количество ультразвуковых составляющих. Например, в спектре трубы (нота четвертой октавы 4466 Гц) отчетливо регистрировались составляющие до 40 кГц с уровнем до 60 дБ, в спектре скрипки до 100 кГц, цимбал до 60 кГц с уровнем до 90 дБ. Наличие таких высокочастотных составляющих влияет на временную структуру сигнала и может оказывать косвенное влияние на прослушивание.

Рис. 6. Реверберационный процесс в помещении

Запись реального реверберационного процесса без потери информации также представляет огромные трудности. Когда источник звука излучает сложный нестационарный музыкальный сигнал, каждый микрофон, установленный в различных точках помещения, «схватывает» сложный отраженный сигнал. Причем дополнительно прибывающие сигналы, измененные по амплитуде и фазе за счет отражений от различных поверхностей, приводят к экспоненциальному возрастанию общего уровня энергии, поступающей на микрофон. При выключении сигнала происходит спад общего уровня, который обычно характеризуется временем реверберации (временем, за который произошел спад уровня сигнала на 60 дБ). Если выполнить детальный анализ процесса спада при помощи импульсного сигнала (рисунок 6), то можно отметить, что первые отраженные сигналы приходят с большой амплитудой и большим разрешением по времени и могут быть хорошо конвертированы в цифровой сигнал. Однако поздние отражения создают огромные проблемы, так как в короткий отрезок времени происходят очень быстрые динамические изменения сигнала.

Для помещения объемом 1000 м³ число отражений через одну секунду после начала реверберационного процесса будет составлять 511,287 отр/с. Это значит, что отраженные лучи будут прибывать с интервалом меньше 2 мкс, вызывая соответствующие флуктуации в выходном сигнале микрофона. Естественно, при временном интервале отсчета семплов 22,7 мс, как для компакт-диска, эти флуктуации никак не смогут быть зарегистрированы.

Тщательные измерения показали также, что в этих отраженных сигналах происходят быстрые амплитудные и фазовые сдвиги и быстрые нерегулярные изменения частоты (частотный джиттер). Когда два или несколько микрофонов распределены в помещении, и при этом еще происходит многодорожечная запись, то эти сложные временные соотношения между сигналами с частотной модуляцией при бинауральном прослушивании создают сдвиги междуушной временной разницы. Как оказалось, слух к этим бинауральным сдвигам (называемым «бинауральный джиттер») очень чувствителен, даже если они составляют доли микросекунд! Кроме того, даже легкое движение исполнителей, воздуха, слушателей и пр. создают дополнительные изменения временных признаков в звуковом сигнале, которые могут восприниматься слуховой системой. <…>

Было показано, что слух особенно чувствителен к флуктуациям временных междуушных задержек в процессе спада сигнала (более чувствителен, чем во время атаки), что особенно важно для слуховой оценки реверберационных процессов в помещении. Минимальная тестируемая разница в двух ушах составляет 6 мкс.

Интересно, отметить, что раньше считалось, будто чувствительность слуха к временным сдвигам сигналов сохраняется, в основном, в диапазоне до 1500 Гц, однако последние результаты показали, что чувствительность к временным различиям сохраняется вплоть до высоких частот для амплитудно-модулированных сигналов, при этом слух извлекает дополнительную информацию из анализа флуктуаций огибающей во времени.

Анализ именно временной разности (а не интенсивностной) является определяющим при локализации сложных сигналов, частично маскирующих друг друга, что типично при восприятии музыкальных сигналов от множественных источников.

Исследования по оценке слышимости упомянутого выше «бинаурального джиттера» (случайных частотных модуляций) показал, что, хотя чистые тоны выше 1400…1600 Гц не могут быть латерализованы, с добавлением случайных частотных модуляций можно выполнить латерализацию сигналов даже при междуушной временной разнице всего в 1,5 мкс. Улучшение бинауральной латерализации к высоким частотам при добавлении джиттера позволяет предположить, что слух отслеживает не только бинауральные временные различия между огибающими сигналов, но и временную междуушную разницу в каждом временном цикле. Удивительно, но было установлено, что слуховая система замечает разницу между чистым импульсным сигналом и сигналом с девиацией всего в 0,2 мкс! Такая высокая бинауральная чувствительность к джиттеру объясняет, почему тонкие частотные флуктуации во время реверберационного процесса в помещении могут быть слышимы. Неизвестно, однако, при какой скорости и уровне флуктуации задержки отраженных сигналов перестают быть слышимыми.

Очевидно, что усредненная импульсная характеристика помещения (дискретизованная и кодированная в цифровой сигнал) не учитывает тонкую структуру и уникальность этих флуктуаций и «затемняет» ощущение присутствия в акустическом окружении. Для этого требуется высокое временное разрешение, частота и точность семплирования, чтобы сохранить каждый бит в описании неоднородностей импульсных характеристик. Неудивительно, что воспроизведение реверберационных процессов представляло значительные трудности для первых цифровых систем из-за потери пространственности (пространство сворачивается в точку) за счет недостатка цифрового разрешения для передачи тончайших временных нюансов в реверберационном процессе. Очевидно, что разрешения в 22,7 мкс (при 44,1 кГц), используемого в компакт-дисках, для этого также явно недостаточно. <…>

Слуховая система способна аккуратно обрабатывать информацию о звуках с задержками до 33 мс, следовательно, первые дискретные отражения воспринимаются и обрабатываются слуховой системой с большой точностью.

Джиттер и модуляционные искажения имеют место во всех звеньях звукозаписи (микрофонах, магнитофонах, громкоговорителях). Наличие джиттера приводит к перераспределению энергии в боковые полосы от основной частоты и может восприниматься на слух как появление некоторой шумовой окраски чистого тона.

Джиттер возникает в аналоговых магнитофонах из-за непостоянной скорости магнитной ленты (в диапазоне от 0,2 Гц до 200 Гц). Кроме того, за счет трения в лентопротяжном механизме возникают продольные колебания ленты (флаттер), что приводит к множественному появлению боковых полос в высокочастотной части спектра. Это обогащает звуковой сигнал некогерентным шумом и создает особое «аналоговое» качество звука (ценимое многими профессионалами). Появление этого флаттер-шума приводит к временным сдвигам сигнала (временным ошибкам), которые оказались равными 10,4 мкс. Отсюда следует, что при переносе на компакт-диск эти флуктуации будут потеряны, так как семплирование сигнала будет происходить только с интервалом 22,7 мкс. <…>

Слух обладает очень высокой разрешающей способностью по времени для периферической зоны слуха (как и для зрения). Периферической считается зона за пределами ±30° от срединной плоскости. Для фронтального прослушивания сдвиг источника звука от 0 до 15° приводит к появлению междуушной разницы по времени более 200 мс. Сдвиг на те же 15° в боковой зоне (от 90 до 75°) приводит к разнице только в 20 мс. Чувствительность к временным различиям в периферической зоне оказывается выше, чем во фронтальной, что принципиально важно для передачи ощущения окружения звуковой средой. Частота дискретизации, используемая в компакт-дисках с разрешением 22,7 мс, оказывается недостаточной, чтобы «схватить» эти тонкие временные сдвиги, что приводит к неточной локализации в периферической зоне и потере ощущения окружения (и, возможно, ощущения глубины).

За последние годы было проведено много исследований в области анализа слышимости ультразвуковых частот. Интересные результаты получены в Японии (проф. Ямомото) где было установлено, что подмешивание ультразвуковых компонент к сигналам звукового диапазона улучшает их слуховое восприятие, в то же время подача одних ультразвуковых компонент не создает слухового ощущения. Несколько авторов описывают эксперименты, подтверждающие способность к восприятию ультразвуковых частот за счет костной проводимости (утверждается даже, что люди с потерей слуха могут за счет этого воспринимать ультразвуковую речь, что кажется уж совсем невероятным).

Эффективность слуховой системы существенно увеличивается с опытом. Например, у опытных звукорежиссеров она существенно выше, чем у обычных слушателей. <…>

Таким образом, анализ показывает, что музыка, исполняемая в помещении, создает сложный звуковой сигнал, который соответствует чрезвычайно тонким и сложным способностям слуховой системы к его анализу. Процесс записи звука должен иметь разрешающую способность, соответствующую как сигналу, так и возможностям слуховой системы. Только когда с помощью новых технологий с высокой разрешающей способностью будет достигнута полная «прозрачность» звука, слушатель сможет ощутить полное погружение в реальную звуковую атмосферу. Технические возможности и эстетические принципы звукорежиссеров могут усилить это чувство погружения за счет расширения перспективы, приближения части звуковой панорамы, вызывающей наибольшее внимание, и других приемов. Чтобы достичь этого контроля над «эффектом присутствия», требуется высокая временная разрешающая способность всех систем записи и обработки звука, соответствующая уникальным возможностям бинауральной слуховой системы.

Прогресс в цифровой технике за последние 20 лет характеризуется повышением прозрачности звука и снижением воспринимаемых искажений.

Низкая разрешающая способность первых цифровых систем приводила к характерным искажениям, например, при записи фортепиано — ненатуральная атака и смазывание среднечастотных звуков, при записи ударных — чрезмерно подчеркнутые переходные, нарушение пропорций. При записи оркестра проявлялся недостаток ясности и четкости каждого компонента партитуры. При записи в реверберирующем помещении исчезали тонкие нюансы процесса реверберации и ощущения пространственности — звуки скорее располагались в плоскости, а не распределялись по глубине, происходило восприятие громкости звука без ощущения его объема…

Новые достижения в сверхбыстрой скорости семплирования (то есть увеличении частоты дискретизации) дали цифровому звуку возможности временного и частотного разрешения, близкого к возможностям слуховой системы, а переход на многобитное кодирование 48 бит и более позволил получить высокое динамическое разрешение. Технология «синтеза волнового поля» (Wave Field Synthesis), когда звук исходит от очень большого количества излучающих поверхностей, окружающих слушателя, создает возможности для высокого пространственного разрешения.

Должен быть достигнут, по-видимому, какой-то оптимальный баланс между этими категориями (временной, частотной, динамической, пространственной и др.), при котором увеличение разрешения в одной из них может позволить уменьшить его в другой. Однако временное разрешение кажется определяющим, поскольку сверхвысокая частота дискретизации повышает слуховую оценку и в других областях.

Улучшение прозрачности требует, чтобы звукозаписывающие и звуковоспроизводящие системы не создавали модуляционных искажений, которые могут маскировать сложные модуляционные процессы, присутствующие в музыке. Уникальные характеристики джиттера (частотных флуктуаций) в записываемом звуке также не должны затемняться общими модуляционными искажениями записывающих систем, чтобы не нанести ущерба отчетливо различающимся модуляциям индивидуальных звуков.

Таким образом, высокая разрешающая способность звукопередающих систем во временной, спектральной, пространственной и динамической областях совместно определяют качество воспринимаемой музыки и речи, при этом разрешение во временной области имеет доминирующее значение для слухового восприятия.

Все представленные выше результаты не дают, конечно, окончательного ответа на поставленный в начале статьи вопрос, но позволяют еще раз подчеркнуть: слуховая система представляет собой сложный преобразователь, обладающий нелинейными свойствами как на высоких, так и на низких уровнях сигнала, и поэтому однозначного соответствия результатов по слуховым порогам в частотной и временной области не существует (поскольку только в идеальных линейных системах может быть адекватный переход, например, с помощью преобразования Фурье, из одной области в другую).

Поэтому анализ чувствительности слуховой системы к тонким изменениям структуры сигнала должен выполняться для различных категорий: временной, частотной, динамической и т. д. Соответственно, усовершенствование способности цифровой аппаратуры к тонкой передаче характеристик только в одной области (например, в частотной) недостаточно — необходимо комплексное улучшение разрешающей способности технических систем по всем направлениям, что и пытается реализовать современная аудиотехника.»

Любопытная статья о психоакустике и о вариантах правильного панорамирования звуковых дорожек.

  1. Как мы слышим? Немного теории.

Звук – это колебание воздуха. У всякого колебания есть частота и амплитуда – отсюда две самых главных характеристики звука – высота и громкость. Частота измеряется в герцах (Гц), то есть в «разах в секунду» (соответственно 10 Гц – это 10 колебаний в секунду). Человеческое ухо воспринимает частоты от 20 до 20 000 Гц. Верхний порог достаточно условен, для разных людей он колеблется от 17 до 20 кГц, причем с возрастом у большинства падает до 16 кГц. Частоты ниже 20 Гц ухом не воспринимаются, но ощущаются телом.

Для громкости принята относительная шкала децибел (дБ), в которой за ноль принят самый тихий уровень звука частотой 1 кГц, который может уловить человеческое ухо. В такой шкале тихий шепот будет иметь громкость 20–30 дБ, обычная речь – 50–60 дБ. Максимум шкалы – болевой порог 120–130 дБ. Для разных частот предел слышимости различный. Лучше всего человек воспринимает средние частоты от 1 до 4 кГц. Именно в этом интервале находятся основные частоты человеческой речи, поэтому слух наиболее восприимчив к ним. Низкие и высокие частоты слышаться хуже. Поэтому даже на самых крутых колонках на малой громкости не удается услышать «басы».

Если одновременно звучат несколько частот, то более громкий звук заглушает (маскирует) менее тихий. Тихие высокие тона хорошо маскируются громкими низкими, а тихие низкие практически не маскируются громкими высокими. Поэтому, например, низкочастотный фон бытовой сети (50 Гц и обертона в 100, 150 и т.д.) в звуке электрогитары гораздо больше действует на нервы чем ровный шум от усилителя.

Мы воспринимаем не только частоту и громкость звука, но и положение его источника. Оно определяется нашим мозгом по двум факторам – как разность громкостей в правом и левом ухе и время запаздывания. Для частот ниже 150 Гц практически невозможно определить местоположения источника. Поэтому бас гитару и бас бочку при сведении композиции всегда панорамируют в центр. Это не оказывает никакого влияния на стереоэффект, зато нагрузка на динамики стереосистемы распределена равномерно (низкие частоты несут гораздо больше мощности, чем средние и высокие). По этой же причине сабвуфер в стереосистемах всегда один.Для частот 150–500 Гц направление определяется временной разностью, для средних (500–5000 Гц) и высоких – обоими факторами.

  1. Что мы слышим? Сведение стерео композиции.

Итак, мы включаем какую-нибудь песню. Что мы слышим? Формально – набор всех частот от 20 до 20 000 Гц, громкость которых меняется во времени. Именно так наши уши и воспринимают композицию. Всю остальную работу проделывает наш мозг. Именно он определяет темп, пульсацию, вычленяет мелодию, аккомпанемент, разбивает на отдельные инструменты. Задача звукорежиссера облегчить эту задачу.

Отстройка громкости

Гораздо проще воспринимать стерео фонограмму, но первый этап сведения, как не странно, обычно проводится в «моно режиме». Это означает, что все инструменты сдвигаются в центр стерео панорамы, все стереоэффекты отключаются. На этом этапе отстраивается громкость инструментов. Начинать следует с ритм секции – отстроить звучание ударной установки и баса, при отключенных остальных каналах (в данном контексте канал – дорожка с инструментом). Затем постепенно подключать остальные инструменты. Субъективную громкость можно менять не только регулируя уровень громкости, но и с помощью тембральной окраски. Звук, в котором понижены высокие и низкие частоты, кажется тише, как бы отодвигается на второй план. В сочетании с наложением реверберации различной глубины, можно весьма реалистично расположить инструменты ближе или дальше от слушателя.

Панорамирование

Когда громкость и тембр отстроены, можно переходить к «расстановке» инструментов в стерео панораме. Положение обычно определяется в процентах: нулю соответствует положение в центре (то есть одинаковая громкость в правом и левом динамике) 100% – абсолютно вправо (звук только в правом динамике) и -100% абсолютно влево (звук только в левом динамике).

В центр практически всегда панорамируется, во-первых, инструменты в нижнем регистре (бас бочка, бас гитара, контрабас) так как их положение все равно не определяется ухом. Во-вторых, инструменты, несущие главную смысловую нагрузку – голос и солирующие инструменты. Слушатель в первую очередь сосредотачивается на том, что находится в центре стерео панорамы, то есть виртуально перед лицом. Если голос будет смещен влево или вправо, то слух будет напрягаться, стараясь разобрать слова.

Остальные инструменты равномерно распределяются по всей стерео панораме. Тут следует учесть два момента. Во-первых, нужно соблюдать баланс в левом и правом канале, суммарная средняя громкость всех инструментов должна быть примерно одинакова в обоих каналах. Во-вторых, не следует смещать все инструменты к краям панорамы (100% или -100%) – в центре всегда должно что-то оставаться. Обычно панорамируют не больше чем на 50–70%. Сваливать все в центр тоже не стоит – чем шире стерео панорама, тем больше объема, живости, тем приятнее звучит композиция.

Дабл трек (Double track)

Этот прием обычно применяется к ритм партиям для придания им объема и плотности. Существует несколько способов реализации этого приема. Идеальный способ – просто записать одну и ту же партию два раза в разные дорожки и развести их влево и вправо. Это требует определенного мастерства от исполнителя. Если сыграть неточно, то получится, вообще говоря, полная каша.

Второй способ – использовать 2 микрофона при записи. Например, динамический установить на расстоянии 15 см от динамика комбоусилителя, а второй конденсаторный на расстоянии 1 м (еще лучше использовать два разных комбоусилителя). Записать сигналы с двух микрофонов в разные дорожки и также развести их по каналам. Эффект будет несколько отличаться от первого способа, но желаемый результат будет достигнут.

Наконец, третий и самый простой способ – для него нужна только одна дорожка. На ней устанавливается задержка между правым и левым каналом порядка 10–15 мс (это легко сделать с помощью обычного эффекта delay). Слух не улавливает такой разницы между сигналами, но звук в левом и правом канале будет отличаться. Объем появиться, однако возникнут фазовые искажения – некоторые частоты будут взаимно уничтожаться, что отразится на качестве звука.

Стерео эффекты

Для финальной шлифовки общего звучания и дополнительного расширения стерео панорамы используются всевозможные эффекты. Самые распространенные: реверб (reverb), хорус (chorus), эхо (echo, delay). Реверб подходит для всех инструментов. Он придает объем, но удаляет от слушателя. Слишком много реверберации мешает читаемости трека. Хорус достаточно специфический эффект, хорошо подходит для баса и вокала. Хорус задумывался как имитация звучания нескольких инструментов, а получился довольно интересный эффект. Эхо можно использовать в моно режиме, оно очень часто применяется для вокала. В стерео режиме, когда задержка между сигналом и его эхом в левом и правом канале различная хорошо, подходит для соло гитары.

В заключение хочу сказать – учитесь слушать. Слушая музыку в метро, или по радио анализируйте как звучат инструменты, как они расставлены в пространстве, какие эффекты использованы. И в путь – экспериментируйте!

Статья взята отсюда: www.amdm.ru

В руб­ри­ке «По­лез­ное чте­ние» мы про­сим экс­пер­тов в об­ла­сти об­ра­зо­ва­ния, дру­зей «Цеха» и из­вест­ных лю­дей рас­ска­зать нам о нон-фикшн кни­гах, ко­то­рые по­мог­ли им в ка­рье­ре, са­мо­раз­ви­тии и са­мо­об­ра­зо­ва­нии. В но­вой под­бор­ке сво­им спис­ком лю­би­мой и по­лез­ной ли­те­ра­ту­ры де­лит­ся со­ос­но­ва­тель лей­б­ла Klammk­lang и ру­ко­во­ди­тель но­во­го ма­ги­стер­ско­го про­фи­ля Sound Art & Sound Stud­ies Шко­лы ди­зай­на НИУ ВШЭ Стас Ша­ри­фул­лин.

Это под­бор­ка книг о том, как на­учить­ся слу­шать мир во­круг нас. Для кого-то эти кни­ги мо­гут стать ру­ко­вод­ством к дей­ствию — и это за­ме­ча­тель­но, по­то­му что зву­ко­вые прак­ти­ки се­го­дня до­ступ­ны как ни­ко­гда; к тому же мы все му­зы­кан­ты, про­сто по­че­му-то не хо­тим это­го при­зна­вать. Дру­гие, на­де­юсь, най­дут в этих кни­гах по­лез­ные со­ве­ты о том, как прак­ти­ки слу­ша­ния мо­гут по­мочь об­ре­сти спо­кой­ствие в наше тре­вож­ное вре­мя.

«Кни­га зву­ка. На­уч­ная одис­сея в стра­ну аку­сти­че­ских чу­дес», Тре­вор Кокс

Ни­кто не пи­шет о при­ро­де зву­ка так увле­ка­тель­но и с та­ким эн­ту­зи­аз­мом, как это де­ла­ет Тре­вор Кокс. Это кни­га о по­ю­щих пес­ках и шпи­он­ских про­слу­ши­ва­ю­щих стан­ци­ях, о по­гре­баль­ных ка­ме­рах и ла­ю­щих ры­бах, о ми­гра­ции ки­тов и су­до­ход­стве. Ис­поль­зуя столь нетри­ви­аль­ные при­ме­ры, Кокс, прак­ти­ку­ю­щий ин­же­нер-аку­стик, про­стым язы­ком объ­яс­ня­ет, как звук ве­дет себя в раз­лич­ных про­стран­ствах и, на­при­мер, рас­ска­зы­ва­ет о шу­мо­вом за­гряз­не­нии. От­лич­ная кни­га для по­гру­же­ния в те­ма­ти­ку.

«Sound. A Very Short In­tro­duc­tion», Майк Гол­дсмит

На­уч­ная база для тех, кто хо­чет за­рыть­ся по­глуб­же. Майк Гол­дсмит окон­чил от­де­ле­ние фи­зи­че­ской и при­клад­ной аку­сти­ки и даже неко­то­рое вре­мя воз­глав­лял На­ци­о­наль­ную фи­зи­че­скую ла­бо­ра­то­рию Ве­ли­ко­бри­та­нии, по­сле чего ре­шил стать по­пу­ля­ри­за­то­ром на­у­ки. Его кни­га из из­вест­ной мно­гим се­рии — это крат­кое и до­ступ­ное вве­де­ние в фи­зи­ку ко­ле­ба­ний и волн, аку­сти­ку, пси­хо­аку­сти­ку и фи­зио­ло­гию слу­ха. Вдо­ба­вок к это­му Гол­дсмит опи­сы­ва­ет ос­но­вы ра­бо­ты со сту­дий­ным и зву­ко­за­пи­сы­ва­ю­щим обо­ру­до­ва­ни­ем, а еще вполне умест­но ссы­ла­ет­ся на ра­бо­ты из­вест­ных куль­тур­ных тео­ре­ти­ков — на­при­мер, на Ро­ла­на Бар­та.

«Раз­го­во­ры с Кей­джем», Ричард Ко­сте­ля­нец

Джон Кейдж не толь­ко на­учил весь мир слу­шать ти­ши­ну, но и под­ска­зал нам, по­че­му все зву­ки, ко­то­рые в этой ти­шине зву­чат, мож­но счи­тать му­зы­кой. Ричард Ко­сте­ля­нец со­брал ин­тер­вью с Кей­джем раз­ных лет, по­ре­зал их на ча­сти и объ­еди­нил в раз­ные те­ма­ти­че­ские бло­ки. По­лу­чи­лось что-то вро­де ав­то­био­гра­фии, в ко­то­рой мэтр рас­ска­зы­ва­ет о раз­ных эта­пах твор­че­ства, сво­ей ра­бо­те с раз­лич­ны­ми ви­да­ми ис­кус­ства и мно­гом дру­гом — на­при­мер, о со­би­ра­нии гри­бов. Эта кни­га для меня в первую оче­редь сбор­ник идей: в про­шлом веке Кейдж был глав­ным со­вре­мен­ным ху­дож­ни­ком из тех, кто ра­бо­тал со зву­ком, и нам всё ещё есть чему у него по­учить­ся.

Ти­ши­на — это из­ме­не­ние мо­е­го со­зна­ния. Это при­ня­тие зву­ка, ко­то­рый уже су­ще­ству­ет, а не же­ла­ние вы­би­рать и на­вя­зы­вать свою соб­ствен­ную му­зы­ку. С тех пор, как я это осо­знал, ти­ши­на за­ни­ма­ет цен­траль­ное ме­сто в моей ра­бо­те. Ко­гда я со­чи­няю му­зы­ку, я ста­ра­юсь де­лать это так, что­бы не на­ру­шать ти­ши­ну, ко­то­рая уже су­ще­ству­ет — Ричард Костелянец

«Шум. По­ли­ти­че­ская эко­но­мия му­зы­ки», Жак Ат­та­ли

К раз­го­во­ру о боль­ших иде­ях про­шлых лет, не утра­тив­ших ак­ту­аль­но­сти: в 1977 году фран­цуз­ский эко­но­мист и по­ли­то­лог, бу­ду­щий со­вет­ник пре­зи­ден­та стра­ны Жак Ат­та­ли пи­шет кни­гу о том, как, ис­сле­дуя му­зы­каль­ную куль­ту­ру, мож­но вы­явить ос­нов­ные прин­ци­пы функ­ци­о­ни­ро­ва­ния об­ще­ства в опре­де­лен­ную эпо­ху, и даже преду­га­дать важ­ные из­ме­не­ния, ко­то­рые мо­гут про­изой­ти в бу­ду­щем. Пред­ска­за­тель­ный по­тен­ци­ал впе­чат­ля­ет боль­ше все­го. На­при­мер, здесь встре­ча­ют­ся раз­мыш­ле­ния о том, что тех­но­ло­ги­че­ский ска­чок в об­ла­сти средств зву­ко­за­пи­си вско­ре при­ве­дет к тому, что му­зы­ка пре­вра­тит­ся в то­вар мас­со­во­го про­из­вод­ства, ста­нет бес­плат­ной или очень де­ше­вой и вслед­ствие по­те­ря­ет свой по­ли­ти­че­ский по­тен­ци­ал. До­ста­точ­но точ­ное опи­са­ние стри­мин­га за трид­цать лет до его по­яв­ле­ния, не прав­да ли? И эта лишь одна из мно­же­ства идей.

«Sound (Doc­u­ments of Con­tem­po­rary Art)», под ре­дак­ци­ей Ка­ле­ба Кел­ли

Неболь­шая, но со­дер­жа­тель­ная хре­сто­ма­тия для тех, кто хо­чет разо­брать­ся во вза­и­мо­от­но­ше­ни­ях зву­ка и со­вре­мен­но­го ис­кус­ства. Здесь со­бра­но мно­го тек­стов раз­ных лет — от ран­них ма­ни­фе­стов фу­ту­ри­стов до вы­дер­жек из ра­бот со­вре­мен­ных тео­ре­ти­ков. Если возь­ме­тесь за эту кни­гу, об­ра­ти­те вни­ма­ние на раз­дел, по­свя­щен­ный на­шей теме — слу­ша­нию. Там есть эссе пи­о­не­ра саунд-арта Эл­ви­на Лю­сье, на­зва­ние ко­то­ро­го, как мне ка­жет­ся, долж­но стать но­вым пра­ви­лом для всех, кто се­го­дня устра­и­ва­ет все эти бес­ко­неч­ные он­лайн-транс­ля­ции: «Важ­нее вни­ма­тель­но слу­шать, чем про­из­во­дить зву­ки». Пе­ча­тая эти стро­ки, я слу­шаю пе­ние птиц за ок­ном — и ка­жет­ся, это луч­шая му­зы­ка, ко­то­рую я услы­шал во вре­мя са­мо­изо­ля­ции.

«Sonic Med­i­ta­tions», По­лин Оли­ве­рос

Пе­рей­дем от тео­рии к прак­ти­ке. Если Ат­та­ли пи­шет о том, что мы все толь­ко долж­ны стать «ком­по­зи­то­ра­ми сво­е­го соб­ствен­но­го слу­ша­ния», то для По­лин Оли­ве­рос мы все уже яв­ля­ем­ся ком­по­зи­то­ра­ми и му­зы­кан­та­ми от рож­де­ния. Как и у преды­ду­щих ав­то­ров, нам оста­лось на­учить­ся слу­шать, и для этих це­лей одна из клю­че­вых пред­ста­ви­тель­ниц аме­ри­кан­ской аван­гард­ной сце­ны пред­ла­га­ет свои «стра­те­гии для вни­ма­ния» — сбор­ник по­э­тич­но оформ­лен­ных упраж­не­ний в му­зы­каль­ной им­про­ви­за­ции и ме­ди­та­ции, для боль­шей ча­сти ко­то­рых не тре­бу­ет­ся ни­ка­ких спе­ци­аль­ных ин­стру­мен­тов или на­вы­ков. Неко­то­рые из них, ка­жет­ся, иде­аль­но под­хо­дят для ре­жи­ма са­мо­изо­ля­ции: «Вый­ди­те на про­гул­ку но­чью. Ша­гай­те так тихо, что­бы ступ­ни ва­ших ног ста­ли уша­ми».

«A Sound Ed­u­ca­tion: 100 Ex­er­cises in Lis­ten­ing and Sound-Mak­ing», Рэй­монд Мюр­рей Шей­фер

Еще один сбор­ник упраж­не­ний для тре­ни­ров­ки осо­знан­но­го от­но­ше­ния к зву­ча­ще­му. Ка­над­ский ком­по­зи­тор и ис­сле­до­ва­тель зву­ка Рэй­монд Мюр­рей Шей­фер был в чис­ле тех, кто впер­вые по­пы­тал­ся об­ра­тить вни­ма­ние че­ло­ве­че­ства на про­бле­мы зву­ко­вой эко­ло­гии, свя­зан­ные с на­рас­та­ю­щим уров­нем ан­тро­по­ген­но­го шума. Рань­ше он с го­ря­щи­ми гла­за­ми го­то­вил ре­зо­лю­ции для ЮНЕ­СКО, а се­го­дня уеди­нил­ся в лес­ной хи­жине, от­ку­да ино­гда от­прав­ля­ет свои немно­го­слов­ные при­зы­вы на­ко­нец-то за­мол­чать и при­слу­шать­ся к окру­жа­ю­ще­му нас миру.

«The Great An­i­mal Or­ches­tra», Бер­ни Кра­уз

Кни­га о боль­шой люб­ви к жи­вот­ным и к зву­кам, ко­то­рые они из­да­ют, а еще непло­хой прак­ти­кум для тех, кто хо­чет вы­учить на­изусть все су­ще­ству­ю­щие зву­ко­под­ра­жа­тель­ные сло­ва в ан­глий­ском язы­ке. Для Бер­ни Кра­у­за все жи­вот­ные на пла­не­те — это огром­ный ор­кестр, ко­то­рый мы долж­ны на­учить­ся слу­шать во всем его мно­го­об­ра­зии, пока у нас еще есть воз­мож­ность. Это и есть ос­нов­ная идея ав­то­ра, по­свя­тив­ше­го по­чти всю свою жизнь по­ле­вым за­пи­сям го­ло­сов жи­вот­ных: зву­ко­вой ланд­шафт ста­но­вит­ся тише, и в этом ви­но­ва­ты мы, люди. По сути, это про­дол­же­ние идей Шей­фе­ра, и как и в преды­ду­щем слу­чае для пол­но­цен­но­го эф­фек­та Бер­ни нуж­но не толь­ко чи­тать, но и смот­реть — на­при­мер, вот это вы­ступ­ле­ние на TEDx раз­би­ло мое серд­це. Еще один груст­ный, но очень по­ка­за­тель­ный при­мер того, как мы мо­жем по­мыс­лить окру­жа­ю­щий мир че­рез звук.

Уже на­мно­го поз­же я узнал, что все жи­вые ор­га­низ­мы про­из­во­дят уни­каль­ные, свой­ствен­ные толь­ко им зву­ки. На­при­мер, ко­гда ви­ру­сы от­цеп­ля­ют­ся от кле­точ­ной по­верх­но­сти, они из­да­ют ко­рот­кий зву­ко­вой им­пульс — рез­кое и быст­рое из­ме­не­ние ам­пли­ту­ды, ко­то­рое мы мо­жем об­на­ру­жить толь­ко с по­мо­щью са­мых чув­стви­тель­ных при­бо­ров — Берни Крауз

Spec­tres: Com­poser l’é­coute / Com­pos­ing lis­ten­ing

Сбор­ник эссе, по­свя­щен­ных раз­лич­ным ас­пек­там слу­ша­ния и зву­ко­во­го твор­че­ства. Ав­то­ры тек­стов и со­ста­ви­те­ли сбор­ни­ка — из­вест­ные му­зы­кан­ты-экс­пе­ри­мен­та­то­ры про­шло­го и на­сто­я­ще­го, чья прак­ти­ка в той или иной сте­пе­ни вос­хо­дит к на­сле­дию пи­о­не­ра в об­ла­сти ис­сле­до­ва­ний зву­ка Пье­ра Шеф­фе­ра, од­но­го из важ­ней­ших де­я­те­лей по­сле­во­ен­но­го му­зы­каль­но­го аван­гар­да. По­лу­чи­лась от­лич­ная под­бор­ка вдох­нов­ля­ю­щих тек­стов, боль­шую часть из ко­то­рых мож­но вос­при­ни­мать как ру­ко­вод­ство к дей­ствию. В этом, по сло­вам со­ста­ви­те­лей, за­клю­ча­ет­ся ос­нов­ная цель кни­ги: на­пом­нить нам о том, что экс­пе­ри­мент это ме­тод, а не эс­те­ти­ка, и при­гла­сить в «пу­те­ше­ствие по неиз­ве­дан­ным тер­ри­то­ри­ям». И это ра­бо­та­ет.

«The Or­der of Sounds: A Sonorous Arch­i­pel­ago», Фран­с­уа Бонне

На­по­сле­док хочу по­со­ве­то­вать не са­мое про­стое чти­во от Фран­с­уа Бонне — фи­ло­со­фа, му­зы­кан­та, хра­ни­те­ля ар­хи­вов Пье­ра Шеф­фе­ра и од­но­го из со­ста­ви­те­лей преды­ду­ще­го сбор­ни­ка. Это не толь­ко крайне де­таль­ное ис­сле­до­ва­ние при­ро­ды зву­ка с фи­ло­соф­ской точ­ки зре­ния, но и свое­об­раз­ный про­ект по эман­си­па­ции слу­ха, осво­бож­де­ния его от вли­я­ния раз­лич­ных со­ци­о­куль­тур­ных кон­струк­тов, к ко­то­рым ав­тор от­но­сит, на­при­мер, му­зы­ку. А еще это на­по­ми­на­ние о все­про­ни­ка­ю­щей при­ро­де зву­ка: он был, есть и бу­дет по­яв­лять­ся вне за­ви­си­мо­сти от того, хо­тим мы это­го или нет.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *