Cuneiform | |
---|---|
Tip de | recunoaștere optică a caracterelor |
Autor | Tehnologii cognitive |
Dezvoltatori | Echipa CuneiForm-Linux |
Scris in | C , C++ |
Interfață | Linie de comanda |
Sistem de operare | Linux , Mac OS X și altele asemănătoare UNIX |
Prima editie | 1996 |
ultima versiune | 1.1.0 (19 aprilie 2011 [1] ) |
Formate de fișiere generate | HOCR |
Stat | abandonat |
Licență | Licență asemănătoare BSD de la Cognitive Technologies [2] |
Site-ul web | launchpad.net/cuneiform-… |
CuneiForm ( ing. cuneiform , cuneiform - cuneiform ), Cognitive OpenOCR este un sistem deschis distribuit gratuit de recunoaștere optică a textului de către compania rusă Cognitive Technologies .
OCR CuneiForm a fost dezvoltat de Cognitive Technologies ca produs comercial în 1993. Sistemul a fost furnizat cu cele mai populare modele de scanere, MFP și software în Rusia și în lume: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti etc. În 2008, Cognitive Technologies au deschis codurile sursă pentru OCR Cunei Form.
CuneiForm este poziționat ca un sistem de conversie a copiilor electronice ale documentelor pe hârtie și fișierelor grafice într-o formă editabilă, cu capacitatea de a păstra structura și tipul de caractere ale documentului original în mod automat sau semi-automat. Sistemul include două programe pentru procesarea unică și în lot a documentelor electronice.
Lista limbilor acceptate de sistem:
În plus, este acceptat un amestec de rusă și engleză. Recunoașterea amestecurilor de alte limbi este acceptată numai într-o ramură dezvoltată de Andrey Borovsky în 2009 [3] . Predarea altor limbi este dificilă din cauza conexiunii fiecărei limbi cu un fișier dat, structura și metoda de obținere care nu au fost dezvăluite de dezvoltatori.
1993 - Cognitive Technologies a încheiat un contract OEM cu corporația canadiană Corel Corporation , conform căruia biblioteca de recunoaștere cognitivă este încorporată în popularul pachet de publicare Corel Draw 3.0 (și versiunile ulterioare). [patru]
1994 - A fost semnat un contract cu Hewlett-Packard pentru setul complet de scanere furnizate Rusiei de OCR CuneiForm. Acesta este primul contract al HP cu un dezvoltator de software rus. [5] [6] [7] [8]
1995 - A fost semnat un contract cu corporația japoneză Epson pentru setul complet de scanere OCR CuneiForm. [9] A fost semnat un contract OEM cu cel mai mare producător de faxuri, imprimante laser, scanere și alte echipamente de birou din lume - Brother Corporation. Conform acordului, noul scaner cu role Brother IC-150 va fi echipat cu software Cognitive pentru scanare, recunoaștere în întreaga lume.
1996 - A fost semnat un contract OEM cu unul dintre cei mai mari producători de monitoare, faxuri, imprimante laser, dispozitive multifuncționale și alte echipamente de birou din lume - Samsung Information Systems America. [10] Conform acordului, noul dispozitiv multifuncțional Samsung OFFICE MASTER OML-8630A va fi vândut cu sistemul optic de recunoaștere a caracterelor Cognitive Cuneiform LE în întreaga lume.
Recunoașterea adaptivă este o metodă bazată pe o combinație a două tipuri de algoritmi de recunoaștere a caracterelor imprimabile: bazați pe font (multifont) și independent de font (omnifont). Sistemul generează un font intern pentru fiecare document de intrare, bazat pe caractere bine imprimate, adică se utilizează ajustarea dinamică (adaptarea) la anumite caractere de intrare. Astfel, metoda combină versatilitatea și fabricabilitatea abordării fără fonturi și acuratețea ridicată a recunoașterii fonturilor, ceea ce face posibilă îmbunătățirea radicală a calității recunoașterii.
1997 - Sistemul CuneiForm a fost primul care a folosit tehnologii bazate pe rețele neuronale. Algoritmii care folosesc rețele neuronale pentru recunoașterea caracterelor sunt construiți după cum urmează. Imaginea caracterului (raster) care vine pentru recunoaștere este redusă la o anumită dimensiune standard (normalizată). Valorile luminozității la nodurile rasterului normalizat sunt utilizate ca parametri de intrare ai rețelei neuronale. Numărul de parametri de ieșire ai rețelei neuronale este egal cu numărul de caractere recunoscute. Rezultatul recunoașterii este simbolul care corespunde cu cea mai mare dintre valorile vectorului de ieșire al rețelei neuronale.
2001 - A fost semnat un contract OEM pentru completarea echipamentelor produse de Canon (scanere, dispozitive multifuncționale) cu software-ul Cognitive Technologies (OCR CuneiForm) în Europa de Est.
Pe 12 decembrie 2007, a fost lansată o versiune freeware a OCR CuneiForm și a fost anunțat codul sursă [15] . [16] [17]
Pe 2 aprilie 2008, codul sursă OCR al Cuneiform a fost publicat sub o licență BSD [18] , iar în toamnă, codul sursă pentru interfața de sistem [19] .
Cea mai recentă versiune OpenSource pentru Windows nu a fost actualizată din februarie 2009.
În 2009, interfețele grafice pentru versiunea deschisă a Cuneiform au fost lansate pe baza bibliotecii Qt 4 - Cuneiform-Qt [20] , YAGF . Începând cu versiunea 0.9.0 [21] , versiunea open source Linux poate fi utilizată ca un .
de recunoaștere optică a caracterelor | Software|||
---|---|---|---|
gratuit |
| ||
proprietate |
|