Rambler's Top100
10 февраля 2012 года
Цифра и звук
Автор: ДМИТРИЙ СИМАНЕНКОВ
Опубликовано в журнале "Компьютерра" №30-31 от 10 августа 1998 года

Практически все звуки не природного происхождения, окружающие нас в повседневной жизни, в той или иной мере подверглись цифровой обработке. Например, если вы говорите по телефону, то весьма вероятно, что ваш телефон или телефон вашего собеседника подключен к цифровой АТС. В этом случае звуки ваших голосов могут преобразовываться в цифровые данные, компрессироваться, передаваться по цифровым каналам и снова превращаться в аналоговые сигналы. Если же вы ведете международный телефонный разговор или используете сотовый телефон, то цифровая обработка звука присутствует наверняка. Если вы решили послушать УКВ-радиоприемник, то знайте, что практически все радиостанции буквально нашпигованы цифровой звуковоспроизводящей техникой и компьютерами. Очень часто музыкальные произведения на радиостанциях хранятся либо на компакт-дисках, либо на жестком диске компьютера, сжатые по стандарту MPEG. Звуковое сопровождение многих телевизионных программ и фильмов создается с применением компьютеров, так что, включив телевизор, вы тоже, скорее всего, услышите в той или иной степени "цифровой звук". Да и на рок-концерте с как бы "живым" звуком вы, скорее всего, увидите на сцене электронные клавишные и гитарные процессоры, являющиеся, по сути, мощными цифровыми устройствами обработки звука.

karikatura

Давайте рассмотрим основные операции, выполняемые со звуковыми сигналами. Это - запись, хранение, сжатие, возможно - шифрование, передача через системы телекоммуникаций и воспроизведение. Возможно, также синтез музыкальных звуков. Запись и воспроизведение нецифровых аналоговых сигналов можно еще как-то оправдать дешевизной (но не качеством) кассетных магнитофонов. А вот сжатие аналоговых сигналов, их шифрование (например, с целью соблюдения конфиденциальности переговоров), передачу десятков и сотен телефонных разговоров по одной паре проводов, аналоговый синтез голоса и музыки современный человек уже может представить себе с очень большим трудом. Именно в этих областях цифровая техника превосходит аналоговую практически по всем параметрам, и по цене, и по качеству, и по размерам и надежности аппаратуры. Особенно заметно преимущество цифровой технологии при копировании, распространении и хранении оцифрованного звука. Копирование цифровых данных, например, с компакт-диска на жесткий диск персонального компьютера, осуществляется байт в байт. Ссылки на несколько известных программ-копировщиков такого рода можно посмотреть на сервере www.geocities.com/SiliconValley/Pines/7899. Если в процессе копирования произойдет ошибка, то операционная система Windows известит вас и предоставит возможность повторить операцию. Таким образом, легко добиться того, чтобы копия полностью совпадала с оригиналом. Для аналоговой техники это просто невозможно! При любом копировании аналогового сигнала неизбежно ухудшается качество звука (в том числе отношение сигнал/шум) и увеличиваются нелинейные искажения. Очень ярко преимущество цифровой техники проявилось в связи с развитием Интернета. Конечно, только "цифровой звук" можно хранить в неограниченном количестве на бесплатных серверах типа www.geocities.com или www.fortunecities.com. Сегодня через Интернет можно скопировать тысячи часов музыкальных произведений практически всех направлений и стилей от классики до рэйва, причем с великолепным качеством, значительно превосходящим звук, который может воспроизвести магнитофон с аналоговых кассет. С помощью специальных поисковых программ в Интернете можно мгновенно найти цифровые записи практически любого исполнителя. Перспективным и интересным экономически представляется использование цифрового звука в Интернет-телефонии. Современные методы цифровой обработки сигналов позволяют передавать через Интернет голос человека с весьма хорошим качеством на скорости 4800 бит/с, а достаточно разборчивую речь на 2400 бит/с и даже 1200 бит/с. Такие скорости передачи информации обеспечивают даже самые плохие модемы на самых плохих линиях связи. Кроме того, Интернет-телефония и цифровой звук - это очень привлекательное направление деятельности для российского малого бизнеса, работающего в области высоких технологий. Для разработки алгоритмов и программного обеспечения для цифрового сжатия речи не требуется огромных инвестиций и суперкомпьютеров - достаточно 486-го компьютера, черно-белого монитора, примитивного модема и - светлой головы. Почти все "голосовые" алгоритмы опубликованы в общедоступной печати, а в Интернете при минимальной настойчивости можно найти и исходные тексты на Си. Разработка аппаратуры переходников телефон-компьютер представляется почти тривиальной задачей и их себестоимость должна быть в районе 50 долларов. Например, в качестве такого устройства с успехом можно использовать любой модем с голосовыми функциями. А рыночная цена "специальных устройств" в настоящее время достигает шестнадцати тысяч долларов за один переходник (Computer World, 21.04.98, стр. 45)! Вот где можно легально получать колоссальную прибыль!
 

Не знаю, как вам, а мне всегда ужасно интересно было, как все происходит в звуковых картах, CD-плейерах, MIDI-синтезаторах и тому подобных железках. Уже года два я искал человека, который, с одной стороны, хорошо в этом разбирается, с другой - умеет писать.

Дмитрий Симаненков из Санкт-Петербурга, на мой вкус, обладает и тем достоинством, и другим, да еще и третьим: он давно и много сам, головой и руками, занимается предметом, о котором пишет. То есть он не только теоретик цифрового звука, но и практик.

Я уже поместил несколько его статей в "Компьютерре": про сравнительный анализ некоторых звуковых карт, например, или про трехмерный звук 1, но предмет, чем внимательнее на него смотришь - тем неисчерпаемее кажется. Тогда я предложил Дмитрию попробовать сделать тему номера целиком, в одиночку. По-моему, единственной неудачей в этом дебюте оказалось неумение уместить хоть сколько-нибудь внятное и систематическое изложение предмета в отпущенные теме номера двенадцать полос журнала. Но, получив от автора на это полную carte blanche, я обнаружил, что сам тоже попросту не могу найти, чего бы безболезненно вырезать.

Пришлось идти на не слишком мною любимый, но время от времени встречающийся в практике "Компьютерры" прием - разбивать тему на два выпуска.

Вступительную статью Дмитрия "Цифра и звук" я помещаю полностью в этом, давая, таким образом, план-проспект на оба выпуска.

Предыдущие "звуковые" статьи Дмитрия вызывали письма-несогласия, письма-поправки (см., например, рубрику "Хвосты" 2), - посему я попросил ознакомиться с материалами экспертов. В результате стали понятными причины несогласий: нигде не отступая от истины, Дмитрий на многие аспекты проблемы имеет собственный взгляд, порою отличающийся от общепринятого. Мне это представляется не недостатком, а, напротив, достоинством, - мотивированные же доводы оппонентов, буде оппоненты появятся, мы с удовольствием (и уж, конечно, с ответами) приведем на наших страницах.

И, возможно, начнем (когда с журнальным местом будет полегче) с уже готовой переписки звукорежиссера Дениса Жалнина (чью статью "Звукочистка" кто-то, надеюсь, помнит по теме "Музыка" в номере 223), рассуждающего о неизбежных потерях в качестве цифрового звука перед звуком аналоговым, и Дмитрия Симаненкова, имеющего прямо противоположную точку зрения, которую он доказывает с формулами в руках и пылом буквально личной заинтересованности.

Евгений Козловский

Подведем итоги всему вышесказанному. Цифровая обработка звука и основанная на этой технологии Интернет- и IP-телефония - это направление, сулящее большие выгоды для конечных пользователей и провайдеров этих услуг. Это потенциально хорошее поле приложения сил для малого бизнеса, приносящее очень высокую прибыль и не требующее значительных долгосрочных инвестиций. Однако российские бизнесмены, легко сделавшие огромные состояния на банальных торговых спекуляциях, "прихватизации" металлургической, нефтяной и газовой промышленности и банковских махинациях, никогда не будут инвестировать в недоступные их пониманию высокие технологии. Парадоксально, но российские высокие технологии погибнут из-за наличия в стране огромных природных богатств. Чтобы подкупить или запугать директора угольной шахты и заставить его продать уголь по дешевке, а потом перепродать по удвоенной цене, ни особого ума, ни высоких технологий не надо!

В следующих статьях будут рассмотрены теоретические и практические аспекты применения цифровой обработки звука. В статье "Из аналога в цифру и обратно: немного теории…" по возможности простым языком с минимумом формул рассказывается о принципах работы современных аналогово-цифровых и цифро-аналоговых преобразователей, использующих цифровую фильтрацию, оверсэмплинг (oversampling), дизеринг (dithering) и нойз-шейпинг (noise shaping). В начале статьи максимально доступно, но математически корректно объясняется процесс оцифровки аналогового сигнала, состоящий из двух последовательных операций - дискретизации по времени и квантования амплитуды. Далее детально обсуждается теорема Найквиста и ее следствия. Убедительно и наглядно показана принципиальная возможность сколь угодно точного восстановления исходного аналогового сигнала с помощью степенной интерполяции и других методов по дискретным отсчетам сигнала, удовлетворяющих теореме Найквиста. Затем рассказывается о методе oversampling и обосновывается необходимость его применения. В статье обсуждаются малоизвестные, но очень важные проблемы дискретизации, например, дискретизация сигналов с частотными компонентами, лежащими выше частоты дискретизации и не удовлетворяющими условиям теоремы Найквиста, а также "размножение" и "свертка" спектра исходного аналогового сигнала при дискретизации и применение цифровых фильтров. В статье уделено внимание проблеме джиттера, возникающего в устройствах на основе интерфейсов типа S/PDIF. В конце статьи рассказывается о принципах современных методов цифровой подготовки сигнала к записи на компакт-диск в формате 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга.

В статье "Цифровая звукозапись музыкальных компакт-дисков" рассматриваются потенциальные возможности и принципиальные ограничения на качество звука для стандартного метода записи компакт-дисков с частотой дискретизации 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга. Приводится обзор программного обеспечения (и его возможностей) для обработки звука на ПК и создания музыкальных компакт-дисков в домашних условиях. В статье также обсуждаются вопросы естественности звучания компакт-дисков, транзисторных, ламповых и цифровых искажений звука, методы борьбы с ними при записи (с применением моделирующих аналоговые системы процессоров) и при воспроизведении с использованием широко применяемых в аппаратуре класса high-end методов цифровой фильтрации и интерполяции. В статье есть раздел, посвященный проблемам перезаписи старых аудиокассет на компакт-диски. В заключении рассматриваются современные тенденции в развитии проигрывателей компакт-дисков класса high-end и их постепенное превращение в нечто, очень напоминающее персональный компьютер с приводом CD-ROM и высококачественной звуковой картой.

В статье "Цифровые синтезаторы музыкальных звуков" подробно рассматривается структура музыкальных сигналов в частотной и временной областях. Иллюстрируются понятия амплитудной огибающей, атаки, поддержки и затухания. В статье также рассмотрены современные представления о фундаментальной частоте музыкальных сигналов и "негармоничности" гармоник и ее влияние на естественность звучания. Детально обсуждаются методы (и их свойства) анализа звуковых сигналов с использованием БПФ и алгоритма сверхвысокого частотного разрешения, разработанных Б. Прони. В статье освещаются некоторые "темные стороны" БПФ, в частности гармоничность "БПФ спектра" белого шума. Далее в статье рассматриваются все основные методы и проблемы (решенные и нерешенные) синтеза музыкальных звуков на основе волновой таблицы (wavetable) с применением интерполяции, pitch-shifter и time-stretch, частотной модуляции, суммирования гармоник, "физического" моделирования и имитаторы аналоговых синтезаторов на примере программ ReBirth и Smorphi.

В статье "Компрессия звуковых данных" рассматриваются методы сокращение объема цифровых данных, необходимых для представления звукового сигнала с заданным качеством с потерями и без потери информации. Обсуждаются алгоритмы, основанные на объективных характеристиках реальных музыкальных и голосовых сигналов, на моделировании физиологического устройства звукоизвлекающего аппарата человека и психоакустических свойствах человеческого слуха. В статье излагаются принципы, положенные в основу алгоритмов адаптивной разностной компрессии, моделирования голосового аппарата человека. Программы на основе этих алгоритмов широко используются в компьютерной и Интернет-телефонии. В статье доходчиво раскрываются психоакустические эффекты маскирования в частотной и временной области, положенные в основу наиболее совершенных методов компрессии музыкальных данных MPEG Audio и Dolby AC-3; обсуждается качество звука, обработанного MPEG, недостатки современных shareware-кодеров и пути их устранения. В заключение статьи анализируется выгодность и перспективность инвестиций в разработку алгоритмов и программных систем компрессии музыкальных сигналов применительно к Интернет-дистрибуции музыкальных произведений.


1 Д. Симаненков: "Объемный звук" (#235); "Проблемы полезности Интернета с точки зрения рядового пользователя (#241); "Частное мнение о звуковых картах" (#242).

2 "Хвосты" ##19 (247) и 24-25 (252-253).

ТАКЖЕ В РАЗДЕЛЕ
24 февраля 2009 года
Не отрываясь 
24 февраля 2009 года
Жилец вершин 
10 февраля 2009 года
Гаджеты, которых нет 
10 февраля 2009 года
Схватка 
10 февраля 2009 года
Список задач 
 
MARKETGID