Hi-Fi БАЗАР

banner myhifi ads

Анкета
Давате ли пари за музика?
Давате ли пари за музика?
Трябва да изберете поне един отговор!

Призракът от MP3-ката

Парче, получено от звуците, които се изрязват при компресия на WAV файл в MP3

 

От Ryan Maquire

Превод със съкращения от http://theghostinthemp3.com/theghostinthemp3.html

 

1.Въведение

MPEG-1 и MPEG-2 Layer III стандартите, по-известни като MP3, станаха повсеместния формат за аудио файлове. За първи път публикуван през 1993, този кодек представляв алгоритъм за компресия със загуба на информация, базиран на сетивния модел на човешкия слух. Слушателски тестове, основно правени от и за западноевропейци чрез използване на музика, която те харесват, са били използвани, за да се усъвършенства кодека. Тези тестове определили кои звуци били важни за въприятята и кои можели да бъдат изтрити или променени, уж без да бъде забелязано. Кои са тези загубени звуци? Дали наистина са звуци, които човешкото ухо не може да чуе в оригиналната им среда поради ограниченията на възприятията или просто са отпадък при кодирането? Знае се, че MP3-китемогат да създадат чуваеми артефакти като например пре-ехо, но как звучи музиката, която този кодек премахва? В настоящата работа се представят техники, измислени и развити, за да възстановят тези изгубени звуци, призраците в MP3, и да се пресъздадат тези звуци като изкуство.

2. MP3 компресията.

MP3 стандартът, създаден в началото на 90-те от Moving Pictures Expeerts Group се превърна в обект на критики в съвременни технологични студии (Sterne, 2006). Впечатляващо е как стандарт, който намалява чуваемото качество на звуковите файлове, остана на мястото си въпреки значително увеличените възможности за пренос и съхранение на данни, което показва предвидливостта (и бъдещето) на създателите на формата. Въпреки това MP3 не винаги е най-подходящият формат за дадена задача и критичната преоценка на технологията и нейните ограничения е неизбежна. Много слушатели днес слушат MP3 файлове, даже в уредби, където предимствата на форматите с по-висока резолюция ще бъдат ясно чуваеми. Това е показателно колко доминиращ е станал този кодек със загуба на качеството. Въпреки широко прикламираното му представяне в слушателски тестове, MP3 компресията генерира чуваеми артефакти и отстранява чуваема звукова информация, особено когато е с нисък битрейт. Например бял, розов и кафяв шум, когато са компресирани на най-ниският възможен битрейт, звучат съвсем различно от обикновения сигнал.

myhifi whitePinkBrownWAV 1

 

Пример 1: Бял, розов и кафяв шум, некомпресирани

 

myhifi whitePinkBrown8kbMP3 2

 

Пример 2: Бял, розов и кафяв шум, възможно най-ниският битрейт MP3 (8kbps)

 

За сравнение, нискочестотен синусоиден звук звучи доста добре като MP3, кодиран на 320kbps. Въпреки това материал, който е бил отстранен, при проучване се оказва доста интересен

myhifi dreamChordsWAV 3

 

Пример 3: Синусоидален тон, некомпресиран

 

 

myhifi dreamChordsMP3 4

 

Пример 4: Синусоидален тон, MP3 320kbps

 

myhifi dreamChordsGhost 5

 

Пример 5: Синусоидален тон, MP3 320kbps, "Призрак"

 

3. Намиране на „призрака”

Използвайки библиотеките на Bregman, pyo и pydub, и LAME MP3 енкодера, започвах с некомрпесирани WAV файлове и ги записах като MP3 файл на 128kbps, който в случая е много подходящ. Използвах 128kbps за тези примери, защото това беше „висококачественият” битерйт, използван при слушателските тестове за разработка на оригиналния MP3 формат. В музиката, която създадох (moDernisT и др.) чрез този процес, използвах MP3 на 320kbps.

myhifi TomsDiner v1 6

 

Пример 6: Tom's Dinner, Версия 1, некомпресирана

 

 myhifi TomsDiner v1 128jcMP3 7

 

Пример 7: Tom's Dinner, Версия 1, MP3 128kbps

 

След това анализирам, сравнявам и взимам разликата пежду двата файла

myhifi TomsDiner v1 128Ghost 8

 

 

Пример 8: Tom's Dinner, Версия 1, MP3 128kbps "Призрак"

 

Където двата файла са идентични или подобни, информацията от оригиналното аудио е била запазенa в по-голямата си част в MP3-ката. Но идентични време-честотни точки, които се различават значително между двата файла издават местата, където информацията е била изменена или изтрита. Възможни са различни техники на извличане, всеки от които води до малко различни резултати:

 

 

Пример 9: Tom's Dinner, Версия 1, MP3 128kbps, "Призрак", получен чрез маскиране

 

 

 

Примери 10 и 11: Tom's Dinner, Версия 1, MP3 128kbps със и без фазова компенсация

 

4. Творчески подход

Както казах, MP3 кодекът е бил усъвършенстван чрез слушателски тестове, организирани от европейски аудио инженери чрез използване на музика, която те са избрали. Най-общо, всяка от тези песни служи като „филтър” за всеки кодиран в MP3 файл: „Tom’s Dinner” на Susanne Vega, “Fast Car” на Tracy Chapman, Концерт за тромпет на Хайдн и т.н. Тези песни оформят кръга звуци, които могат да бъдат успешно кодирани като MP3-ки. Тези песни представляват един вид най-добиря сценарий за MP3 кодиране. Ако нещо може да бъде кодирано най-добре в тозо формат, това трябва да са тези файлове. Но даже тези файлове оставят чуваем остатък, когато са кодирани в MP3. Използването на тези звуци помага да се създадат коите MP3-ки.

 

5. moDernisT.

 Като прелюдия в композирането на този „призрак” на кодека, аз създавам серия от парчета, основана на песните, използвани при слушателските тестове за създаване на MP3. Искам накратко да обясня мойто претиране на Tom’s Dinner. След компресиране на оригиналното аудио до 320kbps MP3, започнах да анализирам структурата на песента, интерпретирайки музиката и текста и след това се опитах да аранжирам най-интересния възстановен материал по същата структура. Като пример за техниките, които използвам искам да обясня два стиха по-подробно. Първият стих намира разказвачката в оживен ресторант, наблюдаваща заобикалящото я. Фокусът на този текст е върху заобикалящото авторката, противоположно на следващите стихове, които са в по-субективно, вътрешно пространство. Използвайки различни техники да събера изгубения материал аз успях да изолирам едновременно чисто, ясно съдържание и по-ефимерни, едва доловими сигнали. Използвайки python lybrary headspace и ревербационен модел на малък ресторант, започнах да конструирам вируално триизмерно пространство.  Започвайки чрез фрагментиране и кодиране на по-тихите сигнали, аз приложих HRTF, за да симулирам фоновите разговори, които могат да се чуят на една вечеря, проследявайки амплитудите на оригиналната мелодия на стиха. Така линия, напомняща оригиналния вокал върви в същия амплитуден контур. Докато конструирах фона, по-ясни звуци от оригиналната мелодия се появяват и изчезват, разположени разнообразно в това виртуално пространство. Тези ефимерни звуци загатват позната мелодия, изграейки с ауралната памет и въображение, трептящо привидение, бродещо по границите на съзнанието.

 

 

Пример 12: moDernisT, Версия 1

 

Версия 5 намира разказвачката в много по-различно психологическо състояние. Вместо лекомислено да се приобщи към разговора, тя се губи в мислите си, спомня си.

 

Пример 13: Tom's Dinner, Версия 5

Съответно придадох на този материал повече пространство. Той е по-малко фрагментиран, постоянния говор отзад е затихал, виртуалното пространсто е свито, чувства се по-скоро като вътрешно, отколкото като външно пространство. Ключови фрази и отрязъци от мелодията се появяват по-ясно и тогава идва финалът, още веднъж загатвайки познатата мелодия, но намеквайки за нея като за бивше присъствие. Ние чуваме главно едва доловими звуци, но вътрешно можем да допълним останалото.

 

Пример 14: moDernisT, Версия 5

 

6. Бъдещето.

Занапред планирам да серия от подобни композиции, конструирани първо от други песни, ползвани при слушателските тестове, но проучвайки МР3 компресията по различни начини в опит да подчертая по-ясно филтриращите ефекти на този кодек. Песните, използвани за разработване на МР3 кодека, са показателни за това, което не са: те не са музика от друга колтура, не са хип-хоп или танцувална музика, нищо с изявени ниски честоти, нищо особено шумно, нито крайно агресивно, нищо lo-fi. Въпреки това тези звуци са били широко инситуционално въприети за общоприети стандарти при продуцентски и записващи техники. Колкото повече МР3-ките нахлуват в модерното пространство, класът „привилегировани” звуци, който форматът неволно създава, става по-явен. Първоначално разработен за некритично слушане, МР3 сега е навсякъде, вкъщи, в магазините, в публичните пространства, във висококачествените уредби на колите. Този формат стана критерий за тези места: позволява да се чуе много хубава музика, да но на цената на огромна част от звука. Композирането с изрязаните звуци и нжектирайки ги обратно в слушателското пространство е един от възможните начини на съпротива, един вид културна критика.

7. Заключение.

Композирането с МР3 файлове е опит да се извлече интересен материал от звуците, които са били премахнати. МР3 призраците и артефактите са трудно предвидими и предоставят външно генериран материал, с който трябва да се работи и композира, но не  ограничават свободата на артиста на реди, променя и интерпретира тези звуци. Изследването на определен формат за неговите естестически възможности е вдъхновено от музиките, сътворени около подобни стари технологии – „tape music”, например. Аз виждам моята „format music” като модерен аналог на тези практики. Всеки от вас, четящите това, е във връзка с технологиите по свой начин. Аз намерих за изключително плодотворно да проучвам ограниченията на технологиите, с които съм обвързан. Надявам се вие също да се заинтересувате от ограниченията наоколо, както го направих аз.