OCR aplikacije: prepoznavanje teksta, popisi, programeri, težina programa, izvršne funkcije, značajke, značajke i povratne informacije korisnika.

Papir kao glavni nositelj informacija postupno gubi na značaju. Umjesto papirnih dokumenata, upotrijebite njihovu elektronsku verziju, ako je moguće. Ali kako prevesti elektroničke arhive u postojeće arhive? Kako bi riješili ovaj problem, kreirani su posebni programi za prepoznavanje teksta.

Što su OCR programi i kako funkcioniraju

Ovi softverski proizvodi koriste ORC (optičko prepoznavanje znakova) ili ICR (Intelligence character recognition) tehnologiju. Na ruskom jeziku, ove kratice se prevode kao "optički" ili "inteligentno prepoznavanje znakova". Programi koji koriste OCR rade ovako. Fotografija s tekstom primljenim od skenera podijeljena je na više fragmenata. Za svaku od njih, program stvara nekoliko pretpostavki. Provjerom i usporedbom sa standardima svaki fragment daje procjenu koja odgovara stupnju slučajnosti. Pri odabiru najvećih od njih, program "vidi" simbol i prikazuje ga u polju ugrađenog uređivača teksta.


IRC radi na isti način, ali se umjetne neuronske mreže koriste za obradu znakova. Glavna prednost ove metode je kompaktnost programa i kontinuirano učenje. To vam omogućuje učinkovito prepoznavanje riječi koje je čovjek napisao velikim slovima. Ali ova tehnologija nije u stanju "pročitati" čvrsti rukopisni tekst. Za svaki od postojećih operativnih sustava, svojeOCR aplikacije. Najpopularniji za Windows je:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • Samsung Scan OCR program;
  • Osim računalnog softvera, postoje mnoge usluge za prepoznavanje teksta na mreži. Među njima, najpoznatiji su FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    Ovaj softverski proizvod je razvila domaća tvrtka ABBYY, jedna je od najboljih među aplikacijama koje koriste OCR. Osnova programa je originalni motor zvan Finereader Engine. Ona pruža sljedeće značajke:
  • Brzo prepoznavanje tiskanog teksta s točnošću većom od 98%. Nestrpljivost kvalitete izvorne slike. Na taj način možete identično prepoznati tekst fotografija snimljenih pomoću skenera ili fotoaparata.
  • ADRT tehnologija omogućuje prepoznavanje ne samo teksta nego i njegova oblikovanja: font, uvlake, paragrafe, stupce.
  • Mogućnost obrade višestruke slike. To vam omogućuje korištenje svih procesorskih jezgri (max 4) za ubrzavanje procesa prepoznavanja.
  • Podržava više od 190 jezika, uključujući i one koji koriste alfabet koji nije latinica ili ćirilica (japanski, kineski, arapski).
  • Ugrađeni uređivač teksta omogućuje vam da provjerite rezultat prepoznavanja ili ga uredite.
  • Interakcija s paketom Office. To vam omogućuje izvoz priznatih tekst u Microsoft Word i Exel za daljnju obradu.
  • Sposobnost proučavanja programa. Ova značajka omogućuje vam da program naučite "čitati" određene oznake slova. Na primjer, nestandardni font ili slova napisana rukom.
  • Rad s PDF-om. FineReader omogućuje prepoznavanje teksta te vrste datoteka i "šivanje" više skeniranih slika u PDF ili PDF /A.
  • Glavni nedostatak ovog programa je cijena. Beskrajna licenca za baznu verziju koštat će 7 tisuća rubalja. Verzije "Business" i "Enterprise" - u 12 i 39 tisuća rubalja, respektivno. Ako je program trebao koristiti samo kod kuće, onda možete preuzeti sa torrent trackera slomljenu 11. i 12. verziju proizvoda.
    Zahtjevi sustava:
  • Procesor: 32 - ili 64-bitni, 1 GHz, i podrška za skup instrukcija SSE 2 (Intel Celeron M i bolji, AMD Athlon 64 i bolji).
  • RAM: 1 GB. Ako procesor ima više od 1 kernela, onda je za svakih dodatnih 512 MB potrebno.
  • Video kartica: Svatko tko podržava razlučivost od 1024 x 800.
  • Tvrdi disk: 3 GB za instalaciju i rad.
  • Skener: podržava TWAIN i WIA upravljačke programe.
  • OS: Windows 788110.
  • Mišljenja korisnika o FineReaderu 14

    Oni pozitivno reagiraju na FineReader, naglašavajući među njima zasluge sposobnost proizvoda da prepozna tekst s loših izvornika papira, praktično i jednostavno sučelje i veliku brzinu. obrada slike. Među problemima koji se pojavljuju pri korištenju ovog OCR programa, neki korisnici ističu zlonamjerno upravljanu sliku. Na primjer: Neodgovarajući rad za podešavanje svjetline skenirane slike.

    OmniPage 18

    Glavni konkurent tvrtke FineReader na ruskom tržištu ORC-programa. Po funkcionalnosti je vrlo sličan protivniku, ali ima nekoliko razlika:
  • Sposobnost pokretanjapostupak skeniranja i prepoznavanja pomoću gumba skenera.
  • Podrška za 4-jezgrene procesore. To vam omogućuje da smanjite vrijeme prepoznavanja i konvertirate više slika odjednom.
  • Izrada vlastite e-knjižnice za buccider (ebook Kindle.
  • Automatsko otkrivanje određenog jezika.
  • Među nedostacima programa može se primijetiti niska brzina, usporediva s 10. verzijom FineReadera, a cijena za kopiju licence - 150 dolara.
    Zahtjevi sustava:
  • Procesor: x32 ili x64-bit, 1 GHz, Intel Pentium i bolje, AMD Athlon i bolje.
  • RAM: 512 MB.
  • Video kartica: bilo koja, podržava razlučivost 1024 x 800 i dubinu boje 16 bita.
  • ​​
  • Tvrdi disk: 11 GB za instalaciju svih komponenti i 100 MB za rad.
  • Skener: podržava TWAIN, WIA i ISIS upravljačke programe.
  • OS: Windows XP SP3 Vista SP2 x32 /x6478.
  • Mišljenje korisnika OmniPagea

    Kažu da je to naglo negativno, jer su problemi prisutni u svim dijelovima programa, od lijepog ali neshvatljivog sučelja do loših upita. Proizvod nije prilagođen za rad u WinXP-u. Može biti prisiljen raditi, ali će morati provesti neko vrijeme. OmniPage ima problema s prepoznavanjem. Na primjer: lako prepoznaje običan crni tekst na listu papira s crtežima, tablicama, dobivenim iz skenera. Kada koristite slike s fotoaparata ili mobilnog telefona, točnost prepoznavanja se smanjuje na 70%, što je vrlo neugodno pri obradi velikih dokumenata.

    Također 18verzija se možda neće pokrenuti zbog pogrešaka u kodu. Da biste riješili ovaj problem, morate instalirati zakrpu 1801.

    Pročitajte Iris Pro 17

    Read Iris je OCR program koji, s manje novca (8000 vs 12000), može uskladiti funkcionalnost i performanse s FineReader-om. Profesionalna verzija ima sljedeće značajke:
  • Puno radno vrijeme s PDF-om: prepoznavanje, stvaranje datoteka za baze podataka, kompresija i glas preko teksta.
  • Podrška za 140 jezika.
  • Prepoznavanje papirnatih tablica i tekstova s ​​mogućnošću izvoza u Exel i Word.
  • Dobivanje slika iz bilo kojeg modela skenera.
  • Tu je i korporativna verzija koja vam omogućuje da zaštitite PDF datoteke s vodenim žigovima i rukujete dokumentima većim od 50 stranica. Zahtjevi sustava:
  • Procesor: x86 ili x64 s 1 GHz ili više.
  • RAM: 1 GB.
  • Video kartica: Svatko tko podržava rezoluciju 1024 x 800.
  • Tvrdi disk: 400 MB za instalaciju.
  • Skener: podržava TWAIN, WIA upravljačke programe.
  • OS: Windows 7810 x32 /x64.
  • Reader's Opiion ReadIris

    Govore o ovom OCR programu za prepoznavanje teksta kao dobar i najbrži PDF u Word konverter s nizom problema:
  • Sofisticirano sučelje u kojem novak nije lako razumjeti.
  • Automatski skenirajte dokument kada promijenite područje skeniranja.
  • Loša tehnička podrška.
  • Ponekad se program ne aktivira zbog grešaka u kodu programa.
  • Samsung Scan OCR program - Što je ovaj program?

    Ovo je slobodan softver koji dolazi s multifunkcionalnim uređajemUređaji "3 u 1" (pisač, skener, fotokopirni uređaj) tvrtke "Samsung". Razvijen je u suradnji s Iris, kreiran ReadIris Pro, optimiziran za rad s proizvođačevim MFP-om. Od originalnog "Readera", Samsung Scan ORC ima sučelje, izrezanu funkcionalnost i veličinu - potrebno je 40 MB na tvrdom disku.

    Online usluge

    One su alternativa aplikacijama za stacionarno prepoznavanje teksta s intenzivnim korištenjem resursa. Na primjer, OCR je FineReader. Svojstva sustava sličnih projekata omogućuju vam da prepoznate tekst sa slika mnogo brže nego na samostalnom računalu. Među uslugama uključenima u primanje teksta s fotografija, možete razlikovati tri od najprikladnijih: FineReaderOnline, FreeOCR, OnlineOCR.
    Prvi je izravni razvoj stacionarne verzije proizvoda. Nakon registracije, novi korisnik dobiva 10 besplatnih stranica za obradu i 5 mjesečno. Ovo ograničenje možete otkazati kupnjom godišnje pretplate za 3200550017800 rubalja za 20005000 odnosno 10.000 stranica. Ako korisnik ima licencu za FineReader 14, onda se samo mora registrirati i aktivirati ga za korištenje u online verziji. U tom slučaju primit će broj stranica koji odgovara vrsti kupljene licence: Standard (2000), Business (5000) ili Enterprise (10.000).
    Usluga onlineOCR.com omogućuje vam da pretvorite 15 slika /sat (ograničenja za neregistrirane korisnike) u tekst i spremite ih kao .docx, .xlsx ili .txt datoteke. Nakon registracije postaje dostupno:
  • Spremanje .pdf .doc, .xlx, .rtf.
  • Pretvaranje više PDF datoteka.
  • Broj stranicapovećava se na 50.
  • Ako stranice nisu dovoljne, mogu se kupiti u iznosu od 50-50000 komada.
    Projekt FreeOCR.com razlikuje se od prethodnog s potpunim besplatnim i bez ograničenja na broj obrađenih stranica. OCR mehanizam ove stranice podržava ruski, ukrajinski, turski, vijetnamski i sve europske jezike - samo 29. Jedini nedostatak ovog portala je raditi samo s grafičkim slikama koje se učitavaju sekvencijalno, budući da redovi obrade nisu osigurani od strane kreatora. Prikazuje prepoznate informacije bez oblikovanja u TXT formatu.

    Mišljenje korisnika o online OCR uslugama

    Ove su stranice potrebne u slučajevima kada je preuzimanje i instaliranje cijelog ORC programa neprikladno. Na primjer, umetnuti u sažetak nekoliko citata iz knjige ili časopisa. Među nedostacima takvih stranica su uvjetno slobodni (FineReader) i slabi funkcionalni (FreeOCR, OnlineOCR). Da sumiramo, možemo reći da postoji mnogo OCR programa za prepoznavanje teksta sa slikama ili PDF-ovima, a članak samo pokazuje najpoznatije. Stoga će OCR programi za svaki skener moći sami birati prema zahtjevima i proračunu. Ili upotrijebite jednu od mnogih besplatnih OCR usluga.

    Povezane publikacije