1. kamerák
  2. Car Audio & Electronics
  3. Home Audio
  4. Personal Audio
  5. TV-k
  6. Okos otthon
  >> Elektronikai Technológia Online >  >> Okos otthon >> Okos élet

Az OCR hátrányai

Az Egyesült Államok postai szolgálata optikai karakterfelismerő (OCR) technológiát használ a leveleken lévő címek olvasásához. Ahhoz azonban, hogy a leveleket egy OCR levélválogató olvassa, a címeket és a betűtípusokat bizonyos módon formázni kell. Az OCR-szoftver hasznos a gépelt vagy kézzel írt dokumentumok beolvasott képeinek kereshető elektronikus szöveggé alakításához, de vannak olyan hátrányai, amelyek korlátozzák az alkalmazását.

Korlátozott dokumentumok

Az OCR a legjobban jó minőségű gépelt dokumentumokkal működik. A kézzel írt dokumentumokat az OCR szoftver nem tudja könnyen elolvasni. Hasonlóképpen, a kézírásra emlékeztető beírt betűtípusok – valamint a nem latin betűtípusok – sok hibát okoznak az OCR-folyamat során. Ha a dokumentum kontrasztja gyenge, gyűrött vagy piszkos, vagy a szöveg és a háttér sötétben hasonló, akkor előfordulhat, hogy az OCR nem működik megfelelően. Az OCR-nek nehézségei vannak a képeket és szöveget egyaránt tartalmazó dokumentumokkal. A táblázatok több hibát is produkálnak.

Pontosság

Egyetlen OCR szoftver sem 100 százalékig pontos. A hibák száma a dokumentum minőségétől és típusától függ, beleértve a használt betűtípust is. Az OCR során előforduló hibák közé tartozik a betűk félreolvasása, az olvashatatlan betűk átugrása, vagy a szomszédos oszlopokból vagy képfeliratokból származó szövegek keverése. Ha nagy pontosságra van szükség – mint a digitális könyvek elektronikus formátumba konvertálásakor –, akkor az elektronikus szöveget meg kell tisztítani.

Megoldások

Az OCR nehezen tudja megkülönböztetni a karaktereket, például a nullát és a nagy „O”-t. Ennek megkerülésére egy speciális OCR-betűtípus használható, például nulla kiírása. Ez azonban csak az OCR szem előtt tartásával létrehozott dokumentumok, például kérdőívek esetében működik. A kézzel írt kérdőívek készítésekor a kutatók minden betűhöz dobozokat is használnak.

További munka

Még ha az eredeti dokumentum beolvasott képe jó minőségű is, további lépéseket kell végrehajtani az OCR-szöveg megtisztításához. Az OCR által okozott hibák kijavítása nagyon munkaigényes. A személynek manuálisan kell összehasonlítania az eredeti dokumentumot és az elektronikus szöveget. Az emberek akkor is hibáznak, amikor szöveget írnak be egy dokumentumból, de néha gyorsabban kihagyják az OCR lépést.


  1. A hátrányai Text Messaging Beszél angolul
  2. A hátrányai Kábel TV
  3. A hátrányai a plazma TV
  4. A hátrányai a plazma TV
  5. A digitális műsorszórás hátrányai