Tehnologia OCR - Caracteristici
Modulul de imagine
Incarcati si salvati imagini in formate precum BMP, PNG, TIFF, PDF si JPEG. Folositi compresia JPEG2000 si JBIG2 (extensie separata).
Pre-procesare
Optimizati rezultatele OCR si curatati imaginile originale, cu caracteristici precum binarizarea adaptiva, filtrele de despeckle, functia de deskew, rotirea documentelor. indepartarea marginilor intunecate, eliminarea liniilor, abandonarea culorii sunt disponibile intr-o extensie separata.
Recunoasterea textului
Versiunea standard a IRIS OCR SDK este disponibila in 137 + limbi, cu diferite suplimente: asiatice, ebraice, arabe, fonturi bancare, ICR.
Recunoastere barcode
Modulul nostru de recunoaștere a codurilor de bare este capabil sa recunoasca codurile de bare populare 1D cum ar fi codul 39, codul 128, EAN, UPC. O extensie suplimentara permite decodarea codurilor de bare 2D pentru recunoasterea PDF417, cod QR si matrice de date.
Document de iesire
Formatele de iesire a documentelor în IRIS OCR sunt: PDF, PDF / A, HTML, XML, RTF, TXT, ODT, WordML, SpreadsheetML, CSV, DOCX, XLSX și XPS. Un modul suplimentar de compresie genereaza fisiere comprimate folosind tehnologia noastra iHQC in PDF și XPS.
Procesarea paginilor
Recunoastere zonala
Recunoasterea automata a orientarii paginii
Corectia automata a perspectivei imaginilor documentelor capturate prin aparatul foto
Capacitati de îndepartare automata a gaurilor de perforare
Adaugati un separator ca o pagina goala sau un cod de bare între fiecare document pentru a spune software-ului OCR sa creeze fisiere diferite de iesire dintr-un singur lot de documente.
Limbi recunoscute
Afaan Oromo, Afrikaans, Albanian, Arabic, Asturian, Aymara, Azeri (Latin), Balinese, Basque, Bemba, Bikol, Bislama, Bosnian (Cyrillic), Bosnian (Latin), Brazilian, Breton, Bulgarian, Bulgarian-English, Byelorussian, Byelorussian-English, Catalan, Cebuano, Chamorro, Chinese (Simplified), Chinese (Traditional), Corsican, Croatian, Czech, Danish, Dutch, English (UK), English (USA), Esperanto, Estonian, Faroese, Farsi, Fijian, Finnish, French, Frisian, Friulian, Galician, Ganda, German, German (Switzerland), Greek, Greek-English, Greenlandic, Haitian Creole, Hani, Hebrew, Hiligaynon, Hungarian, Icelandic, Ido, Ilocano, Indonesian, Interlingua, Irish (Gaelic), Italian, Japanese, Javanese, Kapampangan, Kazakh, Kikongo, Kinyarwanda, Korean, Kurdish, Latin, Latvian, Lithuanian, Luba, Luxembourgish, Macedonian, Macedonian-English, Madurese, Malagasy, Malay, Manx (Gaelic), Maori, Mayan, Mexican, Minangkabau, Moldovan, Mongolian (Cyrillic), Nahuatl, Norwegian, Numeric, Nyanja, Nynorsk, Occitan, Papiamento, Pidgin English (Nigeria), Polish, Portuguese, Quechua, Rhaeto-Romance, Romanian, Rundi, Russian, Russian-English, Samoan, Sardinian, Scottish (Gaelic), Serbian, Serbian (Latin), Serbian-English, Shona, Slovak, Slovenian, Somali, Sotho, Spanish, Sundanese, Swahili, Swedish, Tagalog, Tahitian, Tatar (Latin), Tetum, Tok Pisin, Tonga, Tswana, Turkish, Turkmen (Latin), Ukrainian, Ukrainian-English, Uzbek, Waray, Welsh, Wolof, Xhosa, Zapotec, Zulu.
Recunoasterea scrierii de mana
Scrierea de mana cursiva nu poate fi recunoscuta cu tehnologia OCR, deoarece „recunoasterea optica a caracterelor” este reglata doar pentru textele tiparite
Textul scris de mana poate fi recunoscut numai daca caracterele sunt scrise separat („text imprimat manual”). Acest scenariu de recunoastere este numit ICR si cel mai des utilizat pentru:
- Recunoasterea zonala (OCR, ICR)
- Prelucrarea formularelor
Rezolutia imaginii scanate
Ce rezolutie de imagine este cea mai buna?
Rezolutia de 300 dpi este recomandata pentru scanarea documentelor.
Reguli mai precise pot fi gasite mai jos:
- Pentru textele obisnuite (dimensiunea fontului 8-10 puncte) se recomanda utilizarea rezolutiei de 300 dpi pentru OCR
- O rezolutie mai mica va duce la o degradare a calitatii si a vitezei
- Pentru dimensiuni de font mai mici decat 8 puncte, se recomanda o rezolutie de 400-600 dpi
- Dimensiunea fontului de la 12 la 20 de puncte este cea mai buna pentru o calitate si o viteza mai bune
Scanarea color
Scanare color, gri sau alb-negru, care este cel mai buna?
Recunoasterea corecta a caracterelor depinde de claritatea cu care acestea se disting de fundalul pe care sunt scrise.
Caracterele scrise pe fundaluri gri sau colorate pot duce la erori de recunoastere, deoarece acest fundal îngreuneaza citirea caracterelor. Cu toate acestea, datorita tehnologiei noastre de ultima generatie, culorile sunt interpretate separat si pot fi eliminate în procesul de recunoastere daca au caractere suprapuse. Prin urmare, recomandarea noastra este scanarea color daca documentele au zone de culoare. Cu toate acestea, chiar daca documentele sunt doar alb-negru, recomandam în continuare scanarea color pentru a mentine un flux uniform, deoarece diferenta de viteza dintre scanarea color si scanarea alb-negru este minima.