MP3 - Много музыки из ничего

Устройства, о которых пойдет речь, занимают столько же места, сколько обычные автомагнитола или CD-ресивер, но способны заменить целый чейнджер с зарядным магазином на несколько дисков.


Что такое МР3


Сжатие звуковых и видеоданных получило толчок для развития, когда существовала острая нехватка носителей с емкостью, достаточной для хранения видеоинформации, качественно сопоставимой с форматом VHS.


В середине 80-х при Международной организации по стандартизации (ISO) возникла постоянно работающая группа ученых, назвавшая себя MPEG (расшифровывается как "группа экспертов по движущимся изображениям"). Ее задачей стала разработка алгоритмов сжатия изображения и звука для записи на компакт-диск видеопрограммы той же продолжительности, что и время звучания обычного аудиокомпакта. Иными словами, поток данных за одну секунду (это понятие обозначается термином "битрейт"), идущий с такого диска, должен быть равен тому, который получается при воспроизведении обыкновенного аудиокомпакта (1411,2 кбит/с).


К началу 90-х эта задача была решена, и появились диски типа Video CD. Тогда же начал бурно развиваться Интернет, быстро превратившийся в крупнейший информационный источник. Кроме того, фирма Philips разработала цифровой магнитофон формата DCC, требовавший совершенного алгоритма для сжатия звука.


Создателем MPEG Audio Layer 3, или просто МР3, считается коллектив ученых из немецкого института им. Фраунгофера. Они запатентовали свои алгоритмы для сжатия данных, разработанные на основе алгоритмов MPEG. Новые версии были проще и требовали меньших вычислительных мощностей для работы.


Другие группы энтузиастов разрабатывали собственные алгоритмы на основе оригинального кода MPEG/ISO, в основном для достижения большей аккуратности при сжатии данных и лучшего качества звучания. Их часто называют алгоритмами типа ISO. Созданные на их основе программы стали очень популярными.


Способ сжатия звукоданных МР3 позволяет использовать алгоритмы MPEG-1 и MPEG-2 для битрейтов от 64 до 320 кбит/с и от 8 до 128 кбит/с соответственно. Сами битрейты могут быть постоянными и переменными. Задаются некие рамки "снизу" и "сверху", например, 128 и 256 кбит/с, что позволяет снизить общую скорость потока, но приводит к сильным временным искажениям, выражающимся в детонации и "плавании" звука.


Способы аудиокомпрессии в алгоритмах MPEG-1 и MPEG-2 по сути не отличаются друг от друга. Институт им. Фраунгофера и вовсе обозначает свою версию МР3 как MPEG-2.5. На основе предложенных им алгоритмов работают не только большинство программ-проигрывателей для компьютера, но и микросхемы сигнальных процессоров ведущих мировых производителей - Crystal/Cirrus Logic, Motorola, Thomson Multimedia, Texas Instruments, Analog Devices и десятков более мелких.


МР3 обладает большими сервисными возможностями. После создания файла вы можете сочинить буквенно-цифровой заголовок - ID3-tag. В нем может быть описано название песни, имя исполнителя, указан жанр, год публикации и сам паблишер. ID3-tag версий 1.0 и 1.1 может содержать информацию длиной до 30 символов, а версии 2.0 и выше - 64 и больше.


Принципы работы МР3 таковы. Звукоданные оригинального контекста, пребывающие в цифровом виде, делятся на несколько частотных полос, после чего производится сжатие каждой из них.


Вы, вероятно, слышали о том, что тихие звуки, которые должны, по логике вещей, заглушаться громкими, "отбрасываются". Как это происходит?


Представьте, что у нас есть динамический диапазон от 0 до 96 дБ (именно такой диапазон охватывается при 16-битовом представлении звукоданных компакт-диском). Мощные звуки и звуки средней громкости располагаются в верхней части диапазона - от 0 до 30 дБ. Звуки потише (40 дБ) зачастую можно расслышать лишь в том случае, если их не маскируют более громкие.

Динамический диапазон от 0 до 48 дБ можно представить в восьмибитовой форме, а до 36 дБ - в шестибитовой (на каждый бит линейки квантования приходится 6 дБ динамического диапазона). Представим громкие пассажи в 8-, 6- и даже 4-битовой форме, и это позволит сократить поток информации в два и более раз.


 

Можно прибегнуть и к цифровой компрессии динамического диапазона. Тогда громкие звуки искусственно делают тише, а тихие - громче. Собрав таким образом звуки в кучку, представим их с совсем небольшим числом разрядов квантования.


 

Деление на частотные полосы производят потому, что частота дискретизации в системе "компакт-диск", например, составляет 44,1 кГц, что позволяет записать полосу частот до 22 кГц. Разбив частотный диапазон на группы, представим каждую из них с очень маленькой частотой дискретизации, уменьшив поток данных еще в 4, 6, 8 и более раз.


 

Применение всех указанных мер в комплексе позволяет сжать данные в 4, 8, 10 и даже 20 раз. Например, при битрейте 128 кбит/с степень сжатия составляет 11 раз.


 

При воспроизведении звукоданных им возвращают прежний вид - громкие делают громкими, тихие - тихими, как перед сжатием. Для этого используются данные об истинных уровнях звуков, сохраняемые в специальных таблицах. При сжатии стереозвукоданных может применяться способ Joint stereo (псевдостереофоническое звучание), поэтому к данному способу прибегают лишь в крайних случаях и при очень большой степени сжатия данных для передачи по телефонным проводам через модем.


 

Конeчно, вышеописанная модель компрессии звукоданных неимоверно груба. Исчерпывающую же информацию желающие могут получить на сайте MPEG.


 

MPEG Audio MP3 - не единственный такой алгоритм. Очень похожие принципы лежат в основе алгоритмов ATRAC (система `минидиск`), АС-3 (Dolby Digital для кинотеатров и фильмов на компакт-дисках), WMA (алгоритм фирмы Microsoft для распространения аудиофайлов через Интернет) и т. д. Важно, что большинство микросхем сигнальных процессоров способно работать со всеми перечисленными алгоритмами.


 

Применение одного-двух алгоритмов в конечном аппарате объясняется не техническими проблемами, а желанием или нежеланием производителя проигрывателя платить лицензионные отчисления авторам или обладателям прав на тот или иной алгоритм. Часто более дорогая модель проигрывателя, способная декодировать не только МР3, но и WMA (или что-то еще), физически ничем не отличается от более дешевой, способной декодировать только МР3.


 

Кроме организаций и лиц, использующих МР3 для передачи аудиоинформации через Интернет, и пиратов, применяющих этот способ компрессии для создания сборников из нескольких альбомов на одном диске, МР3 широко используется в радиовещании: существует сеть спутникового вещания DAB (Digital Audio Broadcast), использующая МР3 для сокращения полосы частот (Musicam).


 

В нашей стране, где используются архаичные способы аналогового стереовещания, бродкастеры нашли МР3 другое применение. Записав сотни альбомов на жесткий диск компьютера, легко задать с помощью специальной программы очередность воспроизведения песен и составить временную сетку их передачи в эфир.


 

CD-R и CD-RW как носители


 

Распространение МР3 совпало по времени с ростом популярности однократно записываемых дисков формата CD-R и многократно записываемых CD-RW в качестве аудионосителей в бытовых условиях. Еще большую популярность обрели диски обоих типов как средство переноса данных с компьютера на компьютер, став "помощниками" дисков с данными формата CD-ROM.


 

Запись данных на CD-R и CD-RW неожиданно открыла для владельцев домашних CD-рекордеров новые перспективы использования аппаратуры. Например, многосессионную запись. При этом способе вы можете записать некую порцию данных, после чего не `закрывать` диск и дописать другую порцию данных в другую сессию. Всего на один CD-ROM можно записать до 99 сессий - ровно столько, сколько дорожек на аудио-CD.

Данные на CD-R/RW можно записывать с различными способами представления файлов и их имен. По первоначальному стандарту, со времен покойной операционной системы MS-DOS, файлы не должны иметь имена длиннее восьми символов. После выпуска операционной системы Windows-95 стандартом фактически стал способ Joilet, позволяющий присваивать файлам имена длиной до 64 символов.


 

Тогда же появился способ Romeo, позволяющий применять до 128 символов и совершенно несовместимый с MS-DOS (а также с Windows 2000), но хорошо "ладящий" с Windows ME и ХР.


 

Сами файлы могут записываться традиционным "сессионным" способом по стандарту ISO 9660 и методом пакетной записи по стандарту UDF (как на дисках DVD-Video). Последний удобен для записи на перезаписываемые CD-RW.


 

Дело в том, что при традиционном способе упаковки данных для записи вам приходится стирать весь диск при желании удалить один маленький файл. При пакетной записи данные записываются маленькими `порциями`, что позволяет оперативно удалять и переносить файлы - так же, как в случае с жестким диском или дискетой. По окончании работы над `пакетным` CD вы можете "закрыть" его так, чтобы образовалась одна стандартная сессия, которую может прочесть любой CD-привод.


 

Для чтения еще не завершенного "пакетного" диска требуется специальный драйвер, входящий в состав Windows-98 и более поздних операционных систем; для Windows-95 такой драйвер можно скачать с сайта изобретателя пакетной записи - компании Adaptec/Roxio.


 

Последнее, что следует знать о дисках CD-R и СD-RW, касается их физического устройства.


 

Рабочий слой CD-R нанесен на тонкий лист фольги, который приклеивается к прозрачному акриловому диску-носителю. В условиях жары и высокой влажности лист может отвалиться и свернуться в трубочку.


 

Категорически воспрещается набивать такими дисками CD-чейнджер, находящийся в багажнике, - ошметки дисков в машине, брошенной на солнцепеке или в запотевшем от влаги гараже, могут совершенно испортить механизм проигрывателя. В случае с CD-ресивером на приборной панели это не страшно: во-первых, двигатель и печка сушат проигрыватель и диск, а во-вторых, аппарат легко можно вынуть, оставляя машину на стоянке.


 

Рабочий слой CD-R находится дальше от линзы считывающего устройства, чем у обычного диска. Это значит, что проигрыватель должен быть оснащен совершенной оптикой с возможностью автофокусировки. Многие японские проигрыватели престижных моделей, выпущенные еще в 80-е годы, обладают такой оптикой. С другой стороны, некоторые современные проигрыватели с дешевой, примитивной оптикой не могут их читать. В то же время они часто способны читать CD-RW, у которых рабочий слой расположен на том же расстоянии, что у обычных дисков. CD-RW более устойчивы к влаге и теплу, но осторожность все равно следует соблюдать.

В одном из следующих номеров журнала мы познакомим вас с самыми любопытными, на наш взгляд, головными устройствами, способными проигрывать файлы стандарта МР3.


Роман Пашарин
5 Колесо

04 октября 2003
новости