ВОСПРОИЗВЕДЕНИЕ ЗВУКА

реклама
ВОСПРОИЗВЕДЕНИЕ ЗВУКА
Запись и воспроизведение звука – это область, в которой наука сочетается с искусством
(звукорежиссера). Здесь есть две важные стороны: верность воспроизведения (как отсутствие
нежелательных искажений) и пространственно-временная организация звучаний, поскольку задача
воспроизведения звука электромеханическими средствами состоит не только в том, чтобы воссоздать
звук, максимально приближенный к воспринимаемому в студии или концертном зале, но и в том, чтобы
преобразовать его с учетом той акустической обстановки, в которой он будет прослушиваться.
В графическом представлении простейшую форму имеют звуковых колебания чистых тонов типа
создаваемых камертоном. Им соответствуют синусоидальные кривые. Но большинство реальных
звучаний имеет неправильную форму, которая однозначно характеризует звучание, так же, как
отпечатки пальцев – человека. Всякое звучание может быть разложено на чистые тона разных частот
(рис. 1). Эти тона состоят из основного тона и обертонов (гармоник). Основным тоном (с низшей
частотой) определяется высота ноты. По обертонам мы различаем музыкальные инструменты, даже
когда на них берется одна и та же нота. Обертоны особенно важны тем, что они создают тембр
инструмента и определяют характер его звучания.
Рис. 1. ФОРМА ЗВУКОВОЙ ВОЛНЫ и ее разложение на составные частоты, т.е. на основной тон и
обертоны (гармоники).
Диапазон основных тонов большинства источников звука довольно узок, благодаря чему можно легко
понимать речь и улавливать мотив, даже если у воспроизводящей аппаратуры ограниченная частотная
полоса. Полнота же звучания обеспечивается лишь при наличии всех обертонов, а для их
воспроизведения необходимо, чтобы не искажались соотношения между уровнями основного тона и
обертонов, т.е. частотная характеристика воспроизводящей системы должна быть линейной во всем
диапазоне слышимых частот. Именно такую характеристику (наряду с отсутствием искажений) и имеют
в виду, когда говорят о высокой точности звуковоспроизведения (системы hi-fi).
Громкость. Восприятие громкости звука зависит не только от его интенсивности, но и от многих
других факторов, в число которых входят и субъективные, не поддающиеся количественной оценке.
Важное значение имеет обстановка, окружающая слушателя, уровень внешнего шума, высота и
гармоническая структура звучания, громкость предыдущего звучания, эффект «маскирования» (под
впечатлением предыдущего звучания ухо становится менее чувствительным к другим звучаниям
близкой частоты) и даже эстетическое отношение слушателя к музыкальному материалу.
Нежелательные звуки (шумы) могут казаться более громкими, чем желательные той же интенсивности.
Даже восприятие высоты звучания может зависеть от интенсивности звука.
Восприятие различий в высоте музыкальных тонов определяется не абсолютной величиной частотных
интервалов, а их отношением. Например, отношение двух частот, различающихся на октаву, в любой
части звукоряда равно 2:1. Точно так же наша оценка изменений громкости определяется отношением
(а не разностью) интенсивностей, так что изменения громкости воспринимаются как одинаковые, если
одинаковы изменения логарифма интенсивности звука.
Поэтому уровень громкости звука измеряется по логарифмической шкале (на практике – в децибелах).
Уши человека способны воспринимать звук в колоссальном диапазоне мощности от порога
слышимости (0 дБ) до порога болевого ощущения (120 дБ), соответствующего отношению
интенсивностей 1012. Современное оборудование способно воспроизводить изменения громкости в
пределах порядка 90 дБ. Но воспроизводить весь диапазон слышимости практически и не требуется.
Большинство слушает музыку примерно на уровне негромкой речи, и вряд ли кому-нибудь было бы по
себе в домашних условиях при нормальной громкости оркестра или рок-группы.
Поэтому необходимо регулировать диапазон громкости, особенно при воспроизведении классической
музыки. Это можно делать, постепенно понижая громкость перед крещендо (по партитуре) при
сохранении нужного динамического диапазона. Для других музыкальных материалов, таких, как рок- и
поп-музыка, широко применяются компрессоры, автоматически сужающие динамический диапазон
усиливаемых сигналов. Но в дискотеках уровень звука нередко превышает 120 дБ, что может вызвать
повреждение слуха и привести к полной глухоте. В этом отношении группа повышенного риска – попмузыканты и звукооператоры. Особенно опасны наушники, так как они концентрируют звук.
Большинство слушателей широковещательных программ предпочитают, чтобы все программы
озвучивались примерно на одном и том же уровне громкости и им самим не нужно было регулировать
громкость. Но громкость – субъективное восприятие. Некоторым громкая музыка способна досаждать
больше, чем речь, хотя неразборчивая речь иногда сильнее раздражает, чем музыка той же громкости.
Балансировка звука. В основе хорошего звуковоспроизведения лежит сбалансированность разных
источников звука. Проще говоря, в случае одного источника звука суть хорошего звуковоспроизведения
в том, чтобы сбалансировать прямой звук, приходящий к микрофону, с влиянием окружающей акустики
и обеспечить правильный баланс между прозрачностью звучания и его полнотой, допускающий
нужную степень подчеркивания в тех местах, где это требуется.
Бинауральный слух. Человек легко определяет направление на источник звука, поскольку звук обычно
достигает одного уха раньше, чем другого. Мозг улавливает эту малую разницу во времени и
небольшое различие в интенсивности звучания и по ним определяет направление на источник звука.
Мы можем также определять, что звук пришел спереди, сзади, сверху или снизу. Это объясняется тем,
что наши уши по-разному передают частотный состав звуков, приходящих в разных направлениях (а
также тем, что слушатель редко держит голову абсолютно неподвижно и в вертикальном положении).
Этим объясняется и то, что люди с глухотой на одно ухо сохраняют все-таки некоторую способность
судить о направлении на источник звука.
Бинауральный слух выработался у человека в качестве защитного механизма, но эта способность
разделять звуки – важное условие понимания музыки. Если эту способность использовать при
звукозаписи, то увеличивается впечатление верности и чистоты при воспроизведении.
ЗВУКОЗАПИСЬ
В идеале процесс записи звука от входа записывающего устройства до выхода устройства
воспроизведения должен быть «прозрачным», т.е. ничто не должно изменяться, кроме времени
воспроизведения. Многие годы эта цель казалась недостижимой. Системы звукозаписи были
ограничены в диапазоне и неизбежно вносили те или иные искажения. Но исследования привели к
огромным улучшениям, и, наконец, с появлением цифровой звукозаписи достигнут почти идеальный
результат.
Цифровая звукозапись. При цифровой звукозаписи аналоговый звуковой сигнал преобразуется в код
из последовательностей импульсов, которые соответствуют двоичным числам (0 и 1) и характеризуют
амплитуду волны в каждый момент времени. Цифровые аудиосистемы обладают огромными
преимуществами перед аналоговыми системами в отношении динамического диапазона, робастности
(информационной надежности) и сохранения качества при записи и копировании, передаче на
расстояние и мультиплексировании и т.п.
Аналого-цифровое преобразование. Процесс преобразования из аналоговой формы в цифровую
состоит из нескольких шагов.
Дискретизация. Периодически с фиксированной частотой повторения делаются дискретные отсчеты
мгновенных значений волнового процесса. Чем выше частота отсчетов, тем лучше. По теореме
Найквиста, частота дискретизации должна не менее чем вдвое превышать наивысшую частоту в спектре
обрабатываемого сигнала. Чтобы не допустить искажений, связанных с дискретизацией, на входе
преобразователя необходимо установить фильтр нижних частот с очень крутой характеристикой и
частотой отсечки, равной половине частоты дискретизации. К сожалению, идеальных фильтров нижних
частот не существует, и фильтр с очень крутой характеристикой будет вносить искажения, которые
могут свести на нет преимущества цифровой техники. Дискретизацию обычно проводят с частотой 44,1
кГц, которая позволяет применять практически приемлемый фильтр для защиты от искажений. Частота
44,1 кГц была выбрана потому, что она совместима с частотой строчной развертки телевидения, а все
ранние цифровые записи производились на видеомагнитофонах.
Эта же частота 44,1 кГц является стандартной частотой дискретизации для проигрывателей компактдисков и большей части бытовой аппаратуры, за исключением устройств записи на цифровую
аудиоленту (DAT), в которых используется частота 48 кГц. Такая частота выбрана специально для того,
чтобы воспрепятствовать нелегальному переписыванию компакт-дисков на цифровую магнитную
ленту. В профессиональном оборудовании используется главным образом частота 48 кГц. В цифровых
системах, применяемых для целей вещания, обычно работают с частотой 32 кГц; при таком выборе
полезный диапазон частот ограничивается величиной 15 кГц (из-за предела дискретизации), но частота
15 кГц считается достаточной для целей вещания.
Квантование. Следующий шаг состоит в том, чтобы преобразовать дискретные отсчеты в код. Это
преобразование выполняется путем измерения амплитуды каждого отсчета и сравнения ее со шкалой
дискретных уровней, называемых уровнями квантования, величина каждого из которых представлена
числом. Амплитуда отсчета и уровень квантования редко в точности совпадают друг с другом. Чем
больше уровней квантования, тем выше точность измерений. Различия между амплитудами отсчетов и
квантования проявляются в воспроизводимом звуке как шум.
Кодирование. Уровни квантования считаются в виде единиц и нулей. 16-разрядный двоичный код
(такой же, как используемый для компакт-дисков) дает 65536 уровней квантования, что позволяет иметь
отношение сигнал/шум квантования выше 90 дБ. Получаемый сигнал отличается высокой
робастностью, так как от воспроизводящего оборудования требуется лишь распознать два состояния
сигнала, т.е. определять, превышает ли он половину максимально возможного значения. Поэтому
цифровые сигналы можно многократно записывать и усиливать, не опасаясь ухудшения их качества.
Цифро-аналоговое преобразование. Чтобы цифровой сигнал преобразовать в звуковой, его нужно
сначала преобразовать в аналоговую форму. Такое преобразование обратно аналого-цифровому
преобразованию. Цифровой код преобразуется в последовательность уровней (соответствующих
исходным уровням дискретизации), которые сохраняются и считываются с использованием исходной
частоты дискретизации.
Передискретизация.
Аналоговый
выходной
сигнал
цифро-аналогового
преобразователя
непосредственно использовать нельзя. Его нужно сначала пропустить через фильтр нижних частот,
чтобы не допустить искажений, связанных с гармониками частоты дискретизации. Один из способов
устранения этой трудности – передискретизация: частота дискретизации повышается путем
интерполяции, что дает дополнительные отсчеты.
Коррекция ошибок. Одно из основных преимуществ цифровых систем состоит в возможности
исправлять или маскировать ошибки и дефектные места, причиной которых могут быть грязь или
недостаточное количество магнитных частиц при записи, что вызывает щелчки и пропуски звука, к
которым человеческое ухо особенно чувствительно. Для исправления ошибок предусматривается
проверка на четность, для чего к каждому двоичному числу добавляется бит проверки на четность,
чтобы число единиц было четным (или нечетным). Если из-за ошибки произошла инверсия, то число
единиц не будет четным (или нечетным). Проверка на четность обнаружит это, и либо будет повторен
предыдущий отсчет, либо будет выдано значение, промежуточное между предыдущим и следующим
отсчетами. Такая процедура называется маскировкой ошибок.
Компакт-диск (CD). Компакт-диск оказался первой общедоступной цифровой аудиосистемой. Это
миниатюрная грампластинка диаметром 120 мм с цифровой записью на одной стороне,
воспроизводимой на лазерном проигрывателе.
Полностью записанный диск звучит 74 мин. Он дает почти идеальное воспроизведение с частотной
характеристикой от 20 Гц до 20 кГц и с превышающими 90 дБ динамическим диапазоном, отношением
сигнал/шум и разделением между каналами. Проблема детонационного искажения звука для него не
существует, так же как и проблема износа. Диски прочны, не требуют особой осторожности в
обращении, не боятся пыли (в небольших количествах) и даже царапин, так как все это не наносит
ущерба качеству воспроизведения.
Первый оригинал компакт-диска (мастер-диск) изготавливают методом фотолитографии, используя
лазер для выжигания питов (микроуглублений) на поверхности фоторезиста, нанесенного на
стеклянный диск. В процессе производства питы становятся выступами отражающей нижней
поверхности пластиковых дисков, на которую затем наносится слой прозрачного пластика толщиной
1,2 мм.
Длина питов и расстояние между ними несут цифровую информацию. Питы идут по спирали длиной 5,7
км, которая начинается в центральной части диска, закручивается по часовой стрелке и доходит до края.
Шаг спирали равен 1,6 мкм (примерно 1/40 диаметра человеческого волоса и около 1/60 среднего шага
канавок записи на долгоиграющей пластинке). Информация в цифровом коде считывается лазерным
лучом. Там, где луч попадает в промежутки между выступами, он отражается обратно и
светоделительной призмой направляется на фотоприемник. Когда же считывающий лазерный луч
попадает на выступ, он при отражении диффузно рассеивается (рис. 3). Поскольку компакт-диск
представляет собой цифровую систему, выходной сигнал фотоприемника имеет лишь два значения: 0 и
1.
Рис. 3. КОМПАКТ-ДИСК, увеличенный разрез вдоль дорожки. Сфокусированный лазерный луч,
падающий на участок между двумя выступами (слева), отражается обратно. Луч же, падающий на
выступ (справа), рассеивается во все стороны.
Принцип действия компакт-диска требует предельной точности фокусировки лазерного луча и трекинга
(отслеживания дорожки). Обе функции осуществляются оптическими средствами. Сервомеханизмы
фокусировки и трекинга должны очень быстро действовать, чтобы компенсировать деформацию диска,
его эксцентриситет и другие физические дефекты. В одном из конструктивных решений используется
двухкоординатное устройство с двумя катушками, установленными под прямым углом в магнитном
поле. Они обеспечивают перемещение объектива по вертикали для фокусировки и по горизонтали для
трекинга.
Специальная система кодирования преобразует 8-разрядный звуковой сигнал в 14-разрядный. Такое
преобразование, уменьшая требуемую полосу, облегчает выполнение операций записи и
воспроизведения, вводя при этом дополнительную информацию, необходимую для синхронизации.
Здесь же проводится исправление ошибок, благодаря чему компакт-диск еще менее восприимчив к
мелким дефектам. В большинстве проигрывателей для улучшения цифро-аналогового преобразования
предусматривается передискретизация.
В начале музыкальной программы на компакт-диск записывается сообщение о содержании диска,
точках начала отдельных отрывков, а также о их числе и длительности звучания каждого отрывка.
Между отрывками размещаются метки начала музыки, которые могут быть пронумерованы от 1 до 99.
Длительность воспроизведения, выраженная в минутах, секундах и 1/75 долях секунды, закодирована
на диске и считывается в обратном порядке перед каждым отрывком. Присваивание имен и
автоматический выбор дорожек выполняются с помощью двух субкодов, указываемых в сообщении.
Сообщение выдается при вставлении диска в проигрыватель (рис. 4).
Компакт-диск легко тиражировать. Как только сделан первый оригинал записи, копии можно
штамповать в больших количествах.
В 1997 появилась и к концу века получила распространение оптическая технология хранения
информации на многослойных двусторонних цифровых универсальных дисках DVD. Это, по-существу,
более емкий (до 4Гб) и более быстрый компакт-диск, который может содержать аудио, видео и
компьютерные данные. DVD-ROM читается соответствующим дисководом, подключенным к
компьютеру.
Трехмерный Звук
Для чего нужен и где применяется трехмерный звук
В повседневной реальности мы слышим звуки, приходящие со всех сторон - сверху, снизу, слева и
справа. Наш слуховой аппарат может более или менее точно определять направление на источник звука
и расстояние до него. Поэтому вполне разумно желание, чтобы радиоприемники, телевизоры,
магнитофоны, музыкальные центры, компьютеры и другие воспроизводящие звук аппараты
максимально воссоздавали реальное (или похожее на реальное) трехмерное звуковое поле. Представьте
себе такую картину. Вы смотрите по телевизору фильм ужасов. Главный герой, "окруженный"
таинственными звуками, пробирается через заброшенное кладбище. Однако отождествлять себя с
героем, сопереживать ему сильно мешает то обстоятельство, что таинственные звуки не окружают вас, а
исходят из одной точки - телевизора. Из-за этого мгновенно разрушается вся аура таинственности,
"настрашниться" в полной мере будет проблематично. С другой стороны, оправданность применения
объемного звука в музыкальной звукозаписи не столь очевидна. Дотошное воспроизведение
трехмерных шумов концертного зала действительно впечатляет. Но все это больше курьезы, чем
серьезные музыкальные произведения, изготовленные по технологии объемного звука. А вот
компьютерные игры значительно оживляются трехмерным звуком. Потребители-геймеры и
разработчики компьютерных игр однозначно проголосовали за объемный звук. Что и нашло отражение
в созданном Microsoft программном обеспечении поддержки игровых приложений DirectX,
позволяющим разработчику создавать объемное звуковое сопровождение с использование (или без
использования) аппаратных ускорителей обработки звука наподобие звуковой карты Monster Sound 3D,
Turtle Beach Montego A3DXStream или SoundBlaster Live. В принципе использование
DirectX/DirectSound совместимых звуковых карт должно позволять расставлять виртуальные источники
звука в любой точке пространства, например, вокруг рабочего места журналиста, программиста или
верстальщика. Причем в минимальной, но полнофункциональной конфигурации требуется всего два
реальных (колонки или стереотелефоны) источника звука. Таким образом, можно улучшить обычный
стерео звук от близко стоящих друг к другу колонок (обычно слева и справа от дисплея) виртуально
разместив их на оптимальном для проявления стерео эффекта расстоянии от слушателя. Заметьте, что
при этом реальные колонки вообще не надо передвигать, все сделает 3D звуковой процессор.
Развитие методов воспроизведения и записи объемного звука.
Большинство современных дешёвых и не очень звуковоспроизводящих устройств, включая звуковые
карты для персональных мультимедиа компьютеров, позволяют воспроизводить звук в режиме “3D
Sound” или “Suround”, что можно перевести как “объёмный звук”. Что же это такое и для чего это
нужно? Системы объёмного воспроизведения звука были разработаны потому, что качество звучания,
реализуемое обычной стереофонической системой или головными телефонами, перестало
удовлетворять взыскательных слушателей. Хотя стерео системы и создают эффект пространственного
звучания за счет синтеза панорамы мнимых источников звука (МИЗ) между двумя громковорителями
(рис. 1), все же стереозвучание имеет существенный недостаток. Стереопанорама получается плоской и
ограничена углом между направлениями на громкоговорители.
Рис. 1. Стереопанорама.
Такое звучание в значительной степени лишено естественности, свойственной тому, что достигается в
реальном звуковом поле, когда человек способен воспринимать реальные источники практически со
всех направлений как в горизонтальной так и в вертикальной плоскостях и оценивать, хотя порой и с
ошибками, расстояние до источников звука. Считается, что восприятие звуков с разных направлений и
расстояний имеет важное значение не только как факт их пространственного расположения. Оно
создаёт у слушателя ощущение звучащего объёма (трёхмерного звукового поля), существенно
обогащает тембры музыкальных инструментов и голосов, восстанавливая реверберационный процесс,
свойственный первичному помещению (концерному залу). Обычная стереофония создаёт эффект
пространственного звучания в очень ограниченной области перед слушателем, не позволяет в полной
мере выявить названные особенности восприятия звуков в реальном звуковом поле и, следовательно,
снижает качество звучания.
Квадрофонические системы также не обеспечивают полную имитацию реального звукового поля. Вопервых, при квадрофонии не получается круговая стереопанорама - слушатель ощущает обычную
стерео панораму перед собой и заднюю стерео панораму сзади себя. Во-вторых, все мнимые источники
звука располагаются в одной плоскости и на линии между динамиками, т.е. нет глубины и нет,
собственно, 3-го измерения и трёхмерного объемного звучания (Рис. 2).
Рис. 2. Квадропанорама.
Головные стерео телефоны также не позволяют получить естественное звучание воспроизводимой
фонограммы. Дело в том, что возникающее при этом впечатление бесконечной ширины стереобазы и
четкая локализация звукового изображения внутри головы слушателя не могут удовлетворить
требовательных меломанов. Для устранения эффекта локализации звука внутри головы применяются
схемы подобные приведенной на Рис. 3.
Рис. 3. Блок схема устройства создания объемного звука для стереотелефонов.
Здесь сигналы левого и правого каналов через входные устройства А1 и А2 поступают соответственно
на делители напряжения А3 и А6 и на входы перекрестных каналов, состоящих из линий задержки (ЛЗ)
А4, А5, согласующих устройств А8, А9 и фильтров нижних частот (ФНЧ) Z1, Z2. С делителей А3, А6
сигналы подаются на корректоры АЧХ А7 и А10 и далее - на один из входов сумматоров, а с них - на
входы усилителей мощности для стереотелефонов. Таким образом, на выходе каждого канала
формируется сигнал, состоящий из ослабленного и скорректированного сигнала своего канала и
задержанного и соответствующим образом скорректированного сигнала другого канала. Подобными
устройствами, выполненными в виде приставок или встроенных устройств в настоящее время
оснащены многие музыкальные центры.
После неудач с квадрофонией разработчики видимо решили, что все дело в недостаточном количестве
каналов воспроизведения и на свет появились очень многоканальные монстры.
Рис. 2 Многоканальная система звуковоспроизведения.
Лидерство в создании многоканальных систем звуковоспроизведения захватила фирма Dolby. Ее
система под названием "Multichannel Surround Sound" установлена (по сведениям с www.dolby.com)
более чем в 14000 кинотеатрах. Вскоре бум на супер многоканальность прошел и Dolby разработала
гораздо более аскетичную систему "Dolby Digital Surround", состоящую всего из шести
громкоговорителей (левого, центрального, правого, сабвуфера, левого и правого "surround") и
предназначенную для домашнего применения.
Рис. 3 Система звуковоспроизведения "домашнего театра" Dolby.
Самое смешное, что Dolby Digital удивительно похожа на разработанную в России в 70-х годах систему
звуковоспроизведения ABC. Основной, видимо, незапатентованный должным образом признак (и
отличие от квадрофонии) которой заключается в размещении тыловых громкоговорителей не за
слушателем, а точно слева и справа. Именно такое размещение динамиков позволяет создавать
круговую звуковую панораму и именно на таком расположение динамиков настаивает Dolby.
Совпадение?! Естественно, эти системы звуковоспроизведения не имеют третьего измерения. Наиболее
совершенный метод имитации реального трёхмерного звукового поля это бинауральная звукозапись.
Бинауральный метод состоит в том, что звуковая информация воспринимается микрофонами,
размещёнными в ушных раковинах человека или “искусственной головы” - модели, симулирующей
слуховое восприятие человека.
Сигналы, поступающие с каждого микрофона, усиливаются раздельными усилителями низкой частоты
и воспроизводятся стереотелефонами. В идеале такая система позволяет создать полную иллюзию
естественного звучания. Она как бы переносит слушателя из помещения прослушивания в помещение,
откуда ведётся передача. Однако полноценно прослушивать её можно только с помощью
стереотелефонов и при условии, что в качестве образца для создания искусственной головы
использовалась именно ваша голова. Поэтому для получения максимально возможного эффекта
рекомендуется использовать специальные микрофоны, помещаемые в ваши собственные уши.
Рис. 4 3D микрофон для использования с живой человеческой головой.
Следует отметить, что записи, сделанные с помощью микрофонов, помещенных в ваши собственные
уши, будут иметь ценность в основном только для вас. При прослушивании таких записей другими
людьми могут ощущаться значительные отклонения в структуре воображаемого звукового поля от
оригинала из-за возможных аномалий, значительных отклонений характеристик вашего (или других
людей) слуха от средних значений.
При воспроизведении бинаурального сигнала через звуковые колонки из-за попадания сигнала правого
канала в левое ухо слушателя и наоборот возникают перекрёстные искажения, в конечном счете
сводящие на нет все преимущества бинаурального звуковоспроизведения. Указанные недостатки в
значительной мере удаётся устранить с помощью специальных устройств обработки звуковых сигналов,
позволяющих получить бинауральный эффект при прослушивании бинауральной записи через колонки.
Такие устройства получили название бифонических процессоров. Запись производится с микрофонов,
расположенных в искусственной голове, а воспроизводится после обработки бифоническим
процессором, в котором точно рассчитанная величина сфазированного, задержанного и
скорректированного по частоте сигнала левого канала вычитается из сигнала правого канала и
наоборот. После обработки бифоническим процессором сигналы, приходящие из колонок в уши
слушателя, суммируются так, что левое ухо слышит только сигналы левого канала, а правое - правого.
Таким образом, можно сказать, что бифонический эффект подобен бинауральному и отличается от него
только способом воспроизведения бинауральной записи. И хотя площадь, где он отчётливо проявляется,
невелика, зато, находясь в её пределах, слушатель может иметь представление о расстоянии до
источников звука и их взаимном расположении в пространстве в момент записи. Этого не удаётся
достигнуть при стереофоническом звуковоспроизведении, дающем представление только о
расположении источников звука на линии между звуковыми колонками. Другое интересное свойство
бифонического процессора - это возможность расширения с его помощью стерео базы обычных
стереофонических записей. Конечно, бифонический процессор может быть реализован чисто
программными методами с использованием методов цифровой обработки сигналов в реальном времени.
Теоретические основы 3-х мерного звука
Реальные источники звука (поющая птичка, работающий трактор и т.д.) довольно часто можно
приближенно считать точечными. То есть это моно источники. Стерео эффект возникает при
восприятии звука левым и правым ухом. В зависимости от азимутального, широтного расположения и
дальности до источника звука изменяются частотные характеристики человеческих ушей. Причем
изменяются они не синхронно, по-разному. То есть усредненные частотные характеристики ушей
одинаковы только при расположении источника звука точно в плоскости симметрии головы. На рис. 5
хорошо видна большая разница в форме импульсных реакций и амплитудно-частотных характеристик,
полученных с помощью помещенных внутри ушей микрофонов и смещенного относительно оси
симметрии головы источника звука.
Рис. 6 Частотные характеристики человеческих ушей при несимметричном расположении
источника звука.
Многочисленные измерения показывают значительные изменения частотных характеристик в
зависимости от расстояния и направления на источник звука. Наиболее очевидна разная задержка
сигналов и разница в амплитудах. Видимо, наш мозг каким-то образом анализирует эти изменения и
разницу характеристик и делает вывод о расположении источника звука в 3-х мерном пространстве.
Таким образом, ощущение местоположения источника звука в пространстве тесно связано с
характеристиками звуковоспринимающего аппарата человека (амплитудно-частотной характеристикой
и относительной задержкой сигнала). Для имитации таких свойств можно произвести достаточно
подробные измерения усредненных характеристик нашего слухового аппарата и построить на их основе
цифровые фильтры. Чем детальнее моделируется пространственная частотная характеристика
слухового аппарата, тем сложнее получаются фильтры. После этого создание искусственного
объемного звукового поля будет заключаться в обработке сигналов от моно источников парами (для
левого и правого уха) цифровых фильтров с параметрами, соответствующими желаемому направлению
на источники звука.
Трехмерный звук и персональные компьютеры
В последние несколько лет на рынке появились дешевые и очень мощные процессоры обработки
сигналов (DSP). Фирма Analog Devices (см. www.analog.com) выпускает один из самых интересных на
сегодня процессоров AD21160 SHARC. Это 32-битное устройство с производительностью 1000 MIPS
(миллионов инструкций в секунду), способное обрабатывать целые числа и числа с плавающей точкой.
Система команд этого DSP весьма совершенна и очень удобна для программистов и позволяет легко
решать как системные, так и специфические вычислительные задачи типа цифровых адаптивных
рекурсивных и нерекурсивных фильтров для трехмерного звука, БПФ и операций с матрицами. Имеется
компилятор с языка C. На кристалле размещается быстрая RAM объемом от 250 кБ до 2 МБ и масочное
ПЗУ, процессоры ввода вывода, DMA контроллеры и быстрые последовательные порты. Возможна
организация многопроцессорной системы. SHARC имеет небольшие габариты (27 mm * 27 mm) и
потребляет всего 9 ватт. Столь малая потребляемая мощность позволяет устанавливать несколько таких
DSP на малогабаритные PCI карты. Менее совершенные предшественники AD21160 широко
используются в звуковых картах Monster Sound 3D. SHARC в настоящее время, применяется в
основном в мощной современной студийной аппаратуре (например, DSP/FX cards).
Рис. 7 Процессор обработки сигналов SHARC
Приборы обработки звуковых сигналов более узкого назначения выпускаются фирмами Vortex Chips
(Aueral AU8820, 330 MIPS) и E-mu (EMU10k, 1000 MIPS). Первый из них используется в звуковой карте
Turtle Beach Montego A3DXStream, второй в SoundBlaster Live от Creative Labs. Кстати, забавные
сплетни о стремлении Creative Labs. запатентовать даже самые банальные вещи типа 8-точечной
интерполяции, кэширования данных и табличного синтеза можно прочитать по адресу
www3.techstocks.com/~wsapi/investor/repliestothis-3560864. Система команд AU8820 и EMU10k
значительно проще набора инструкций AD21160 и ориентирована на табличный синтез музыкальных
звуков (64..128 голосов), электронные эффекты реверберации, флэнжера, хоруса, разнообразной
фильтрации и трехмерного звука (до 32 источников звука). DSP производятся также фирмами Motorola
и Texas Instruments и имеют параметры, незначительно уступающие характеристикам выше
перечисленных устройств. Наличие на рынке столь совершенных устройств позволило создавать
относительно недорогие звуковые карты, оснащенные DSP и способные в реальном времени
реализовывать бифонические процессоры и цифровые фильтры, необходимые для качественного
моделирования человеческого слухового аппарата. Таким образом, 3-х мерный звук из экзотики
превращается в стандартную функцию практически любой современной звуковой карты среднего
ценового диапазона. В дополнение к цифровым имитирующим фильтрам такие звуковые карты
позволяют реализовывать эффект Доплера (смещение высоты звука движущегося источника),
придающий еще большую реалистичность компьютерным играм. Некоторые звуковые карты с DSP
(www.sblive.com) имеют богатый набор звуковых эффектов, ревербераторов и фильтров, иногда
существенно улучшающих звучание компакт дисков (но это все же дело вкуса). Любители домашней
компьютерной звукозаписи также имеют возможность поэкспериментировать с 3-х мерным звуком.
Практически для всех популярных программ редактирования звуковых файлов имеются так называемые
plug-ins, поддерживающие создание объемно звучащих произведений (см. www.qsound.com).
Скачать