1. kamerák
  2. Car Audio & Electronics
  3. Home Audio
  4. Personal Audio
  5. TV-k
  6. Okos otthon
  >> Elektronikai Technológia Online >  >> Car Audio & Electronics >> Autó hangszórók és mélynyomók

Mi az MP3 fájl?

Az elmúlt 15 évben soha nem beszélhetett hangról és számítógépekről, és nem hallott MP3 fájlról. Az MP3 audiofájlok és webhelyek, az eredeti Napsterhez hasonlóan, változást indítottak el abban, hogy az emberek hol, hogyan és mikor szereztek zenét. Ha Ön a spektrum régebbi végén jár, mint sokan a mobilelektronikai iparban, akkor a CD-ket, kazettákat és talán még a bakeliteket is egy lemezboltban vásárolta. A számítógépek és az internet megváltoztatta ezt. Vacsora után felléphet az internetre, és néhány perc alatt letölthet egy dal illegális másolatát. Rossz volt, de az emberek több tízmillió dalhoz jutottak így.

Az 1990-es években és a 2000-es évek elején az internethez való hozzáférés lassú volt. Elkezdtünk csatlakozni az internethez telefonvonalak és modemek segítségével. Az információ minden egyes bájtjának átvitele a számítógépre időbe telt, így minden, ami felgyorsítaná a folyamatot, nagyszerű volt. Az MP3-audiofájl népszerűsége a zenék interneten keresztüli letöltése (lopása) találkozott vele.

A digitális hang alapozója

Tíz cikket írhatnánk a digitális hangról – és meg is tennénk. Egyelőre az alapokat fogjuk megnézni, és referenciaként a CD-t (CD-t) használjuk. A CD-k 16 bites felbontású, 44,1 kHz-es mintavételezett digitális hangot tárolnak. Ezek a számok azt jelentik, hogy minden minta amplitúdója lehet egyetlen érték 65 536 különböző szint tartományában (2-től 16 hatványáig). Az információ mintavételezése másodpercenként 44 100 alkalommal történik. Az úgynevezett 44.1/16-os mintavételezés lehetővé teszi a hang hallható tartományának (20 Hz-től 20 kHz-ig) megfelelő részletes és pontos rögzítését.

Ahhoz, hogy 1 másodpercnyi hangot tároljunk ezen a felbontáson, 1 411 200 bitnyi információt kell tárolnunk. Bárki, aki játszott hangátkódoló szoftverrel, az 1411 kbps-t ismerheti fel szabványos adatátviteli sebességként. Ezt a számot úgy számítjuk ki, hogy a mintánkénti bitek számát (16) megszorozzuk a másodpercenkénti minták számával (44 100) és 2-vel. A 2-szeres tényező azért van, mert sztereóban rögzítünk – ami két csatornás. Tehát egy 3 perces zeneszám 254 016 000 bit vagy 31 752 000 bájt.

Kerekítsük 31 megabájt információra. El tudja képzelni, mennyi ideig tart letölteni ezt egy 14 400 baudon működő betárcsázós modemmel? A válasz legalább 3,5 perc – hibaellenőrzés, vonalzaj és egyéb olyan tényezők nélkül, amelyek a valós letöltési időt körülbelül 5,5 percre lassítják.

Adattömörítés

Mi van, ha valaki megtalálja a módját az audiofájl méretének csökkentésére a letöltési idő felgyorsítása és a sávszélesség-használat csökkentése érdekében? A figyelmeztetés az, hogy a hang lényegében ugyanúgy szól a legtöbb alapvető audiorendszeren, mint például a TV, a számítógép hangszórói vagy az 1990-es évek gyári autórádiója. 1991-ben egy vállalatcsoport, köztük a Fraunhofer Institute, a France Telecom, a Philips, a TDF és az IRT, elkezdett dolgozni azon, hogy csökkentsék a fájlméretet a releváns információk megőrzése mellett. Ez a kulcsa annak, hogyan csökkenthető a fájl mérete MP3-tömörítéssel.

Az MP3 fájlformátum egy „veszteséges tömörítési” algoritmus. A veszteséges tömörítés azt jelenti, hogy az információ kidobásra kerül a fájlméret csökkentése érdekében. A fejlesztőcsapat az észlelési kódolásnak nevezett tömörítési módszeren dolgozott, hogy eldöntse, milyen információkat távolítson el. Az észlelési kódolás azon alapul, hogy hogyan halljuk a hangokat más információkhoz viszonyítva, valamint a hallásunk határain.

Mit dobnak ki az MP3-fájlok

Elemezzük azokat az információkat, amelyeket az MP3-fájlok eltávolítanak a fájlméret csökkentése érdekében. Az információtárolás csökkentésének egyik legegyszerűbb módja a reprodukálandó legmagasabb frekvencia csökkentése. Ha egy 128 kbps-os MP3 fájlt elemezünk, azt látjuk, hogy a legmagasabb reprodukált frekvencia valamivel 16 kHz alatt van. Ha ez lenne az egyetlen információ, amelyet eltávolítottunk volna, az új bitrátánk 16 bites sztereó mintákkal körülbelül 1 004 800 kbps lenne a 20,05 kHz-es 1 411 200 kbps helyett.

A tömörítési folyamat következő része a mindkét csatornán közös tartalmat elemzi. Gyakori, hogy a felvétel egyes részei gyakorlatilag monóban vannak. A kódolási folyamat eltávolítja a duplikált információkat a fájlból, és kódot ad hozzá az ellenkező csatorna másolásához. Ha a hangsáv tisztán monó lenne, a fájl mérete két részre oszlik. Kevés szám teljesen mono, de több helymegtakarítást tapasztalhatunk ezzel a folyamattal.

A későbbi feldolgozás az alacsony szintű információkat vizsgálja a nagy amplitúdójú áthaladások során. Használjuk egy olyan dal példáját, amelyben sok basszus van, és nagyon halk harmonikus középső információ. Az észlelési kódolási folyamatok, mint például az MP3, eltávolítják ezeket az alacsony szintű információkat a hangsávból. Ezt a folyamatot hangmaszkolásnak nevezik. Elegendő hanginformáció áll rendelkezésre más frekvenciákon ahhoz, hogy elvonja a figyelmét az eltávolítottak hallásáról.

Hallod a különbséget?

Több tucat – nem, több száz – teszt hasonlította össze az MP3 fájlokat teljes CD-minőségű hangsávokkal. Vannak különbségek? Biztosan vannak. Egy dolog nyilvánvalóvá vált kutatásunk során:az MP3 fájl létrehozásának módja döntő jelentőségű a szubjektív hangminőség szempontjából. A különböző kódolók eltérő módon működnek, eltérő eredménnyel.

Talán a legjobb módja annak, hogy leírjuk a különbséget a CD-minőségű felvétel és az MP3 fájl között, ha megvizsgáljuk a kettő közötti különbséget. Szeretnénk, ha megosztanánk itt néhány mintát, hogy meghallgathassák, de ez sértené a szerzői jogi törvényeket. Amit tehetünk, az az, hogy vizuálisan megmutatjuk a különbséget.

3 másodperces mintát vettünk a Daft Punk „Give Life Back to Music” című dalából. Azért választottuk ezt a számot, mert a Daft Punk világos és tudatos erőfeszítéseket tett az album nagy felbontású változatának kereskedelmi forgalomba hozatalára. Ezt szeretnénk nekik megköszönni! A minta 31,5 másodperctől 34,5 másodpercig tart a dalban.

Ez a spektrogram a minta frekvenciatartalmát mutatja. A vízszintes skála az idő. A függőleges skála a frekvencia. Végül a színintenzitás az amplitúdót mutatja.

Látható, hogy 30 kHz-ig terjedő frekvenciatartalom található, ami egyértelműen mutatja ennek a sávnak a nagyfelbontású jellegét. Minden függőleges színsáv egy dobgép ütemét képviseli – többé-kevésbé.

128 kbs MP3 fájlelemzés

Nyilvánvaló, hogy a 16 kHz feletti hanginformációt eltávolították. Az infrahangfrekvencia-tartalom is egyértelműen eltérő. Az MP3 fájlban több információ található 30 Hz alatt az eredetihez képest. Ez az információnövekedés azonban kevésbé dinamikus tartományként jelenik meg.

MP3 vs eredeti fájl

Megfordítottuk az MP3 fájlt, és hozzáadtuk az eredeti mintához, hogy az itt látható kép legyen. A nettó eredmény a két pálya közötti különbség. Láthatja a 16 kHz felett eltávolított nagyfrekvenciás tartalmat. Valójában az információkat minden frekvencián eltávolították, és ez az információ követi az audiofájl intenzitási mintáját.

Az eredeti fájl csúcsamplitúdója mindkét csatorna esetében -0,1 dB, átlagos amplitúdója pedig körülbelül -14,2 dB. Az eltávolított információ csúcsszintje -10,9 dB, átlagos amplitúdója pedig -37,01. Az eltávolított információ mélyen a csúcsamplitúdó információ alatt van eltemetve.

Hogy hangzik az eltávolított hang? A klipet egy távoli felvonuló zenekar hangjaként írnánk le. A hang többnyire magas frekvenciájú információ. A számnak is határozottan vontatott textúrája van:a dobgép ütemei tiszták és jelen vannak, de úgy szólnak, mint egy torz cintányérsláger.

Még csúcskategóriás fejhallgató-előerősítővel és stúdióminőségű fejhallgatóval is nehéz észrevenni a különbséget, amikor az eredeti zeneszám és az MP3 fájl között váltunk. Nagyobb hangfelülettel rendelkező hallgatási környezetben ez nyilvánvalóbb lehet.

Következtetések az MP3 fájlokról

A puristák azt fogják mondani, hogy a lehető legjobb minőségű felvételekkel kell rendelkeznie. Ennek a logikának nincs hibája. Miért fukarkodik, ha mindent megkaphat? A nagy bitsebességű MP3-fájlok, például a 320 kbps-os fájlok minősége kiváló. Az ismételt tesztelés kimutatta, hogy minőségi tömörítési algoritmusokkal létrehozva szinte lehetetlen észlelni a hangkülönbséget a CD-minőségű felvétel és a 320 kbps-os MP3 fájl között. Az alacsonyabb bitsebességű MP3-fájlok több információval kezdenek rendelkezni, és a különbségek nagyobbak lesznek.

A piacon kapható legújabb forrásegységek nagy felbontású és bitmélységű WAV és FLAC audiofájlok lejátszására képesek. Hamarosan látni fogunk olyan egységeket, amelyek digitális kapcsolatokon keresztül játsszák le az MQA fájlokat. Szinte minden forrás kezeli az MP3 és WMA fájlokat.

Látogasson el még ma a helyi mobilelektronikai szakkereskedésbe, és vigyen magával egy kis zenét, hogy élvezze. Úgy gondoljuk, hogy le fog nyűgözni – függetlenül attól, hogy milyen formátumot választ.


  1. Mi az ALX fájl ?
  2. Mi Audio Transformer ?
  3. Mi az a CD-MP3 lejátszás sztereó ?
  4. Mi az SACD ?
  5. Mi a CDA Audio File ?