Pomôžte rozvoju stránky a zdieľajte článok s priateľmi!

Tento článok bude doplnkom k predchádzajúcemu článku (https://pcpro100.info/skanirovanie-teksta/) a podrobnejšie objasní podstatu priameho rozpoznávania textu.

Začnime so samotnou podstatou, ktorú mnohí používatelia úplne nerozumejú.

Po skenovaní knihy, novín, časopisov atď. Získate súbor obrázkov (tj grafické súbory, nie textové súbory), ktoré musíte rozpoznať v špeciálnom programe (jeden z najlepších je ABBYY FineReader). Rozpoznanie je a je proces získavania textu z grafiky a práve tento proces budeme písať podrobnejšie.

V mojom príklade urobím snímku obrazovky z tejto stránky a pokúsim sa získať text z nej.

1) Otvorenie súboru

Otvárame obrázky, ktoré plánujeme rozpoznať.

Mimochodom, je potrebné poznamenať, že môžete otvoriť nielen formáty obrázkov, ale aj napríklad súbory DJVU a PDF. To vám umožní rýchlo rozpoznať celú knihu, ktorá sa v sieti zvyčajne distribuuje v týchto formátoch.

2) Úprava

Hneď súhlasím s automatickým rozpoznávaním veľkého zmyslu nie je prítomný. Ak máte, samozrejme, knihu, v ktorej môžete len text, obrázky a tablety a skenované vo vynikajúcej kvalite. V ostatných prípadoch je najlepšie nastaviť všetky oblasti manuálne.

Zvyčajne musíte najprv odstrániť nepotrebné oblasti zo stránky. Ak to chcete urobiť, kliknite na tlačidlo Upraviť na paneli.

Potom musíte nechať len oblasť, s ktorou chcete pracovať dlhšie. Za týmto účelom existuje nástroj na orezávanie nepotrebných okrajov. Na pravej strane stĺpca vyberte režim orezania .

Ďalej vyberte oblasť, ktorú chcete zachovať. Na obrázku nižšie je zvýraznený červenou farbou.

Mimochodom, ak máte niekoľko obrázkov otvorených, orezanie môže byť použité na všetky obrázky naraz! Je výhodné nerezať každý samostatne. Venujte pozornosť, na spodku tohto panelu je ďalší nádherný nástroj - guma . Pomocou obrázka môžete vymazať nepotrebné škvrny, čísla stránok, škvrny, nepotrebné špeciálne znaky a jednotlivé oblasti.

Po kliknutí na orezanie okrajov sa má zmeniť pôvodný obrázok: zostane len pracovný priestor.

Potom môžete opustiť editor obrázkov.

3) Výber oblastí

Na paneli nad otvoreným obrázkom sú malé obdĺžniky, ktoré určujú oblasti skenovania. Existuje niekoľko z nich, skúmme to najčastejšie.

Obrázok - táto oblasť nerozpozná program, skopíruje zadaný obdĺžnik a prilepí ho do rozpoznaného dokumentu.

Text je hlavnou oblasťou, na ktorú je možné zamerať program a pokúsiť sa získať text z obrázka. Túto oblasť vyberieme v našom príklade.

Po výbere je oblasť lakovaná v svetlozelenej farbe. Potom môžete prejsť na ďalší krok.

4) Rozpoznávanie textu

Po nastavení všetkých oblastí kliknite na príkaz menu, ktorý chcete rozpoznať. Našťastie, v tomto kroku, nič viac nepotrebujete.

Čas rozpoznávania závisí od počtu strán v dokumente a od výkonu počítača.

V priemere jedna celá stránka naskenovaná v dobrej kvalite trvá 10-20 sekúnd. na priemerný výkon počítača (podľa dnešných štandardov).

5) Kontrola chýb

Bez ohľadu na pôvodnú kvalitu obrazu, sú po rozpoznávaní vždy vždy chyby. Napriek tomu žiadny program nie je schopný úplne vylúčiť prácu osoby.

Kliknite na možnosť začiarknutia a program ABBYY FineReader vám začne zobrazovať striedavo miesta v dokumente, kde mal chybu. Vaša úloha porovnávajúca pôvodný obrázok (mimochodom, toto miesto vám ukáže v rozšírenej verzii) s variantom rozpoznávania - odpovedajte kladne alebo opravte a schvaľujte. Ďalej sa program presunie na ďalšie komplexné miesto a tak ďalej, kým sa neoverí celý dokument.

Vo všeobecnosti môže byť tento proces dlhý a nudný …

6) Ochrana

Program ABBYY FineReader ponúka niekoľko možností pre uloženie vašej práce. Najčastejšie sa používa "presná kópia". tj celý dokument, text v ňom bude tiež formátovaný, rovnako ako zdrojový kód.Vhodná voľba pre prenos do programu Word. Tak sme to urobili v tomto príklade.

Potom uvidíte rozpoznaný text v známom dokumente programu Word. Myslím, že ďalšia maľba, čo robiť s tým, nemá zmysel …

Preto sme na konkrétnom príklade analyzovali, ako preložiť obrázok do obyčajného textu. Tento proces nie je vždy jednoduchý a rýchly.

V každom prípade bude všetko závisieť od pôvodnej kvality obrazu, vašich skúseností a rýchlosti počítača.

Úspešná práca!

Pomôžte rozvoju stránky a zdieľajte článok s priateľmi!