Hogyan csökkenti az MP3 audio formátum az adatméretet?
1. Pszichoakusztikus modell: Ez az MP3 tömörítés magja. Azon alapul, hogy az emberi fül hogyan érzékeli a hangot. A kódoló elemzi az audio jelet, és azonosítja a frekvenciákat és hangokat, amelyeket valószínűleg a hangosabb hangok elfednek, vagy kevésbé érzékelhetők hallásunkhoz. Ezeket a maszkolt frekvenciákat ezután erősen tömörítik, vagy teljesen eldobják. Például egy csendes, magas frekvenciájú hang, amelyet egyidejűleg hangos, alacsony frekvenciájú hanggal lejátszottak, teljesen hallható lehet, tehát eltávolítják.
2. Frekvencia -transzformáció: Az audiojelet az időtartományból (amplitúdó idővel) a frekvenciatartományra (különböző frekvenciák amplitúdójává) alakítják át. Ezt általában módosított diszkrét koszinusz -transzformációval (MDCT) végzik. Ez a reprezentáció lehetővé teszi az egyes frekvenciák könnyebb azonosítását és manipulálását.
3. kvantálás: A frekvenciaanalízis után az egyes frekvenciakomponensek amplitúdó -értékei kvantálódnak. Ez azt jelenti, hogy korlátozott számú értékre kerekítik őket. Ez bizonyos információvesztést vezet be, de mivel a kevésbé fontos frekvenciákat azonosították, és potenciálisan eltávolították vagy erősen tömörítik, a hallható hatás minimalizálódik.
4. Huffman kódolás: Végül, a kvantált adatokat a Huffman kódolásnak nevezett változó hosszúságú kóddal kódolják. Ez rövidebb kódokat hozzárendel a gyakoribb adatokhoz és a hosszabb kódokhoz a ritkábban, ami további adatcsökkentést eredményez.
Lényegében az MP3 kihasználja az emberi hallás hiányosságait és korlátait, hogy jelentősen csökkentse az audio ábrázolásához szükséges adatok mennyiségét, miközben fenntartja az elfogadható audiominőséget. A tömörítés szintje (és így a méretcsökkentés) beállítható, különböző fájlméreteket és az audiominőség eltérő szintjét eredményezve. A magasabb kompressziós arányok kisebb fájlokhoz vezetnek, de potenciálisan észrevehetőbb tárgyak vagy hűség elvesztése.