Cuneiform

Cuneiform
Tip de recunoaștere optică a caracterelor
Autor Tehnologii cognitive
Dezvoltatori Echipa CuneiForm-Linux
Scris in C , C++
Interfață Linie de comanda
Sistem de operare Linux , Mac OS X și altele asemănătoare UNIX
Prima editie 1996
ultima versiune 1.1.0 (19 aprilie 2011 [1] )
Formate de fișiere generate HOCR
Stat abandonat
Licență Licență asemănătoare BSD de la Cognitive Technologies [2]
Site-ul web launchpad.net/cuneiform-…

CuneiForm ( ing.  cuneiform , cuneiform  - cuneiform ), Cognitive OpenOCR  este un sistem deschis distribuit gratuit de recunoaștere optică a textului de către compania rusă Cognitive Technologies .

OCR CuneiForm a fost dezvoltat de Cognitive Technologies ca produs comercial în 1993. Sistemul a fost furnizat cu cele mai populare modele de scanere, MFP și software în Rusia și în lume: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti etc. În 2008, Cognitive Technologies au deschis codurile sursă pentru OCR Cunei Form.

Caracteristici

CuneiForm este poziționat ca un sistem de conversie a copiilor electronice ale documentelor pe hârtie și fișierelor grafice într-o formă editabilă, cu capacitatea de a păstra structura și tipul de caractere ale documentului original în mod automat sau semi-automat. Sistemul include două programe pentru procesarea unică și în lot a documentelor electronice.

Lista limbilor acceptate de sistem:

În plus, este acceptat un amestec de rusă și engleză. Recunoașterea amestecurilor de alte limbi este acceptată numai într-o ramură dezvoltată de Andrey Borovsky în 2009 [3] . Predarea altor limbi este dificilă din cauza conexiunii fiecărei limbi cu un fișier dat, structura și metoda de obținere care nu au fost dezvăluite de dezvoltatori.

Istorie

1993  - Cognitive Technologies a încheiat un contract OEM cu corporația canadiană Corel Corporation , conform căruia biblioteca de recunoaștere cognitivă este încorporată în popularul pachet de publicare Corel Draw 3.0 (și versiunile ulterioare). [patru]

1994  - A fost semnat un contract cu Hewlett-Packard pentru setul complet de scanere furnizate Rusiei de OCR CuneiForm. Acesta este primul contract al HP cu un dezvoltator de software rus. [5] [6] [7] [8]

1995  - A fost semnat un contract cu corporația japoneză Epson pentru setul complet de scanere OCR CuneiForm. [9] A fost semnat un contract OEM cu cel mai mare producător de faxuri, imprimante laser, scanere și alte echipamente de birou din lume - Brother Corporation. Conform acordului, noul scaner cu role Brother IC-150 va fi echipat cu software Cognitive pentru scanare, recunoaștere în întreaga lume.

1996  - A fost semnat un contract OEM cu unul dintre cei mai mari producători de monitoare, faxuri, imprimante laser, dispozitive multifuncționale și alte echipamente de birou din lume - Samsung Information Systems America. [10] Conform acordului, noul dispozitiv multifuncțional Samsung OFFICE MASTER OML-8630A va fi vândut cu sistemul optic de recunoaștere a caracterelor Cognitive Cuneiform LE în întreaga lume.

Recunoașterea adaptivă  este o metodă bazată pe o combinație a două tipuri de algoritmi de recunoaștere a caracterelor imprimabile: bazați pe font (multifont) și independent de font (omnifont). Sistemul generează un font intern pentru fiecare document de intrare, bazat pe caractere bine imprimate, adică se utilizează ajustarea dinamică (adaptarea) la anumite caractere de intrare. Astfel, metoda combină versatilitatea și fabricabilitatea abordării fără fonturi și acuratețea ridicată a recunoașterii fonturilor, ceea ce face posibilă îmbunătățirea radicală a calității recunoașterii.

1997  - Sistemul CuneiForm a fost primul care a folosit tehnologii bazate pe rețele neuronale. Algoritmii care folosesc rețele neuronale pentru recunoașterea caracterelor sunt construiți după cum urmează. Imaginea caracterului (raster) care vine pentru recunoaștere este redusă la o anumită dimensiune standard (normalizată). Valorile luminozității la nodurile rasterului normalizat sunt utilizate ca parametri de intrare ai rețelei neuronale. Numărul de parametri de ieșire ai rețelei neuronale este egal cu numărul de caractere recunoscute. Rezultatul recunoașterii este simbolul care corespunde cu cea mai mare dintre valorile vectorului de ieșire al rețelei neuronale.

1999

2001  - A fost semnat un contract OEM pentru completarea echipamentelor produse de Canon (scanere, dispozitive multifuncționale) cu software-ul Cognitive Technologies (OCR CuneiForm) în Europa de Est.

Pe 12 decembrie 2007, a fost lansată o versiune freeware a OCR CuneiForm și a fost anunțat codul sursă [15] . [16] [17]

Pe 2 aprilie 2008, codul sursă OCR al Cuneiform a fost publicat sub o licență BSD [18] , iar în toamnă, codul sursă pentru interfața de sistem [19] .

Cea mai recentă versiune OpenSource pentru Windows nu a fost actualizată din februarie 2009.

În 2009, interfețele grafice pentru versiunea deschisă a Cuneiform au fost lansate pe baza bibliotecii Qt 4  - Cuneiform-Qt [20] , YAGF . Începând cu versiunea 0.9.0 [21] , versiunea open source Linux poate fi utilizată ca un .

Interfețe grafice pentru CuneiForm

Vezi și

Note

  1. Port of Cuneiform pentru Linux. . Preluat la 22 iulie 2008. Arhivat din original la 20 mai 2011.
  2. Textul licenței. Arhivat din original pe 19 martie 2012.
  3. ~anb-symmetrica/cuneiform-linux/cuneiform-multilang : revizuirea 400
  4. Fabricat în Rusia (link inaccesibil) . Preluat la 6 decembrie 2016. Arhivat din original la 27 iunie 2013. 
  5. Scanerele HP „ Legitime ” vor învăța să citească limba rusă
  6. Scanere HP marcate de CuneiForm . Data accesului: 6 decembrie 2016. Arhivat din original pe 20 decembrie 2016.
  7. Hewlett-Packard prezintă noi produse la Moscova Arhivat 16 aprilie 2014 la Wayback Machine , Algonet
  8. HP și Cognitive deepen partnership Arhivat 20 decembrie 2016 la Wayback Machine , PCweek
  9. Lumea PC. Perle de software rusesc . Consultat la 29 noiembrie 2016. Arhivat din original la 16 aprilie 2014.
  10. Samsung selectează OCR al tehnologiei cognitive pentru dispozitivele All-In-One Arhivat 20 decembrie 2016 la Wayback Machine , PCweek, 09/10/1996
  11. Vladimir Mitin Dispozitivele multifuncționale Canon au achiziționat o nouă copie de arhivă de calitate din 20 decembrie 2016 la Wayback Machine , PCweek, 05/12/1998
  12. Vladimir Mitin Alianța Canon -Cognitive Technologies se dezvoltă cu succes
  13. Cognitive Technologies and OKI step on the gaz Arhivat 20 decembrie 2016 la Wayback Machine , PCweek
  14. HP Informal Marketing Arhivat pe 20 decembrie 2016 la Wayback Machine , Computer World
  15. OCR CuneiForm - primul proiect industrial Open Source în domeniul recunoașterii Arhivat la 25 mai 2011.
  16. Sistemul rusesc de recunoaștere a textului CuneiForm va deveni deschis . Copie de arhivă din 20 decembrie 2016 pe Wayback Machine Сybersecurity, 12/06/2007
  17. CuneiForm Returns Arhivat 20 decembrie 2016 la Wayback Machine , Computerworld, 24.12.2007
  18. Cognitive Technologies open source Cuneiform OCR code (downlink) . Consultat la 4 aprilie 2011. Arhivat din original pe 11 noiembrie 2009. 
  19. Cognitive Technologies Open Cuneiform OCR Code Arhivat 19 aprilie 2011.
  20. Cuneiform-Qt . Consultat la 9 aprilie 2009. Arhivat din original pe 12 aprilie 2009.
  21. Este lansat Cuneiform Linux 0.9.0 . Data accesului: 8 februarie 2010. Arhivat din original la 26 ianuarie 2014.

Link -uri