1. kamerák
  2. Car Audio & Electronics
  3. Home Audio
  4. Personal Audio
  5. TV-k
  6. Okos otthon
  >> Elektronikai Technológia Online >  >> Okos otthon >> Okos élet

UTF 7 vs. UTF 8

Az UTF-7 és az UTF-8 egyaránt a Unicode Transformation Format típusa, a 16 bites Unicode karakterek, például nemzetközi betűk és speciális szimbólumok kódolására szolgáló szabvány, olyan formátumban, amely 7 vagy 8 bites rendszereken keresztül továbbítható. Az UTF-8 a leggyakrabban használt kódolási formátum, amely népszerű a weboldalakon és számos levelezőprogramban. Az UTF-7 kódolást biztosít bizonyos e-mail protokollokhoz, amelyek nem működnek UTF-8-cal.

Unicode

A Unicode egy nemzetközi szabvány a karakterek egész számként történő megjelenítésére. Karakterenként 16 bitet használ, szemben az ASCII, az információcsere amerikai szabványos kódja által használt hét bittel. Az ASCII csak 128 karaktert képes reprodukálni, szemben a Unicode-ban elérhető 65 000 egyedi karakterrel. Ez a szélesebb karakterválaszték teszi a Unicode-ot megfelelőbbé kelet-ázsiai nyelvekhez és más, nagy karakterkészlettel rendelkező nyelvekhez, de a Unicode karaktereket kódolni kell, ha 7 bites vagy 8 bites csatornákon kell továbbítani őket.

UTF-8

Az UTF-8 a legelterjedtebb univerzális átalakítási formátum, amelyet a Unicode karakterek 8 bites szegmensekké alakítására használnak az interneten e-mailben vagy más 8 bites csatornákon keresztül történő továbbításhoz. Ez a kódolási formátum minden Unicode karaktert egy-négy oktettre változtat, a Unicode karakter egész értékétől függően, és nagyon hatékony azoknál a dokumentumoknál, amelyek elsősorban az ASCII karakterkészletben is megtalálható betűket használnak. Az UTF-8 általában több helyet foglal, mint az egybájtos kódolás a nem nyugati ábécék esetében.

UTF-7

Az UTF-7 az 1990-es évek közepén először javasolt Universal Transformation Format speciális változata. Úgy tervezték, hogy Unicode-szöveget ASCII-karakterekkel jelenítsen meg, és az UTF-8-nál hatékonyabb kódolási módszert hoz létre az e-mailekhez, valamint a 7 bites adatútvonalon keresztüli továbbításhoz szükséges idézett nyomtatható kódolást. Az UTF-7 kódolás használata jelentősen csökkenti a kódolt karakterek méretét.

Megfontolások

Bár az UTF-7 hatékonyabb 7 bites csatornákon, mint az UTF-8 plusz idézhető nyomtatható, a legtöbb hatóság, köztük az Internet Mail Consortium és a Microsoft Developer Network, az UTF-8 használatát javasolja az UTF-7 felett, amikor csak lehetséges. Ennek az az oka, hogy az UTF-7 biztonsági és robusztussági problémákat okoz, amelyek a 8 bites rokonaiban nem jelennek meg. Az IMC azt is javasolja, hogy az 1999. január 1. után létrehozott összes levélmegjelenítő program képes legyen UTF-8 formátumban megjeleníteni a leveleket.


  1. Hogyan lépjünk be a MacBook BIOS-ba
  2. Hogyan használhatja Mac billentyűzetét MIDI-eszközként a Pro Toolsban
  3. Sony térhatású hangrendszer hibáinak elhárítása
  4. Weboldalak átalakítása egyszerű szöveggé
  5. Unicode-szimbólumok beszúrása a Facebookba