Autor Wątek: Tesserat OCR  (Przeczytany 2241 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline Grzegorz Gałęzowski

  • archiwista
  • ***
  • Wiadomości: 444
  • Płeć: Mężczyzna
Tesserat OCR
« dnia: Kwiecień 09, 2019, »
Dla osób, które potrzebują zrobić OCR a nie mają dostępu do komercyjnego oprogramowania
można skorzystać z dobrodzejstwa biblioteki Tesseract.
Dostępne są nakładki graficzne z interfejsem graficznym na wszystkie popularne systemy operacyjne w tym i na Windows.
Poniżej link do wersji na system Windows:
https://github.com/A9T9/Free-Ocr-Windows-Desktop/releases

Tesseract umożliwia też przygotowanie aplikacji dostępnej online obsługiwanej przez przeglądarkę.
Na Githubie można odnaleźć gotowe rozwiązanie bazujące na JavaScript, Python, Java, Ruby, C# itd.

Poniżej inne platformy:
https://github.com/tesseract-ocr/tesseract/wiki/User-Projects-%E2%80%93-3rdParty

Do programu potrzebne będą dane obsługujące określone języki (jest obsługa języka polskiego, rosyjskiego i nawet egzotycznych):
https://github.com/tesseract-ocr/langdata
https://github.com/tesseract-ocr/tessdata

Można pobrać wszystkie co będzie się wiązało z tym, że oprogramowanie będzie obsługiwać wszystkie dostępne języki.

Na tej stronie można znaleźć porównanie skuteczności Tesseract do FineReadera:
http://dl.psnc.pl/2012/07/20/raport-dotyczacy-porownania-silnikow-ocr-finereader-i-tesseract/


Poniżej notka o licencji Apache2 na opiera się ten projekt:
http://www.kbskancelaria.pl/pl/aktualnosci/korzystanie-z-utworow-publikowanych-na-licencji-open-source-na-przykladzie-apache-license/8/

Poniżej filmik prezentujący instalację:
https://ocr.space/blog/p/free-ocr-windows.html