Rozpoznawanie tekstu na obrazie, czyli programy OCR dla Tłumacza

Rozpoznawanie tekstu na obrazie, czyli programy OCR dla Tłumacza

Przy realizacji tłumaczeń, często spotkacie się z problemem rozpoznawania tekstu na obrazie. Niektóre dokumenty do tłumaczenia przesyłane są w formie skanów w zamkniętych formatach graficznych, zazwyczaj z rozszerzeniami .jpg, .png lub .pdf. Ręczne przepisywanie tekstu jest bardzo czasochłonne. Istnieją jednak rozwiązania, dzięki którym możecie ułatwić sobie pracę. Chodzi o programy OCR, które wspomogą pracę związaną z tłumaczeniami zamkniętych plików graficznych.

Co to są zamknięte pliki graficzne?

Zacznijmy od wyjaśnienia, czym w zasadzie są te zamknięte pliki graficzne. Najczęściej dotyczą zdjęć lub skanów, zapisanych w formacie .jpg lub .png. Ich cechą charakterystyczną jest brak możliwości zaznaczenia dowolnego fragmentu treści, aby skopiować go do edytora tekstowego. 

Często są to również np. skany samochodowych dowodów rejestracyjnych. Z zasady takie dokumenty zapisane są w formacie .pdf. Istnieją dwa rodzaje plików z tym rozszerzeniem – otwarty i zamknięty. W przypadku otwartych PDF’ów istnieje możliwość skopiowania tekstu, grafiki i innych elementów i wklejenia do edytora tekstowego, np. Worda lub LibreOffice. Zamknięte PDF’y nie dają takiej możliwości.

Czym są programy OCR?

Problem ten można rozwiązać, korzystając z programów OCR (skr. od Optical Character Recognition). Są to narzędzia, których zadaniem jest optyczne rozpoznawanie znaków. Pozwalają więc na odczytanie tekstu ze zdjęć, skanów oraz innych zamkniętych plików graficznych. Z tego rozwiązania korzysta również część aplikacji służących do tłumaczenia, np. Tłumacz Google czy Prizma Go.

Dostępnych jest bardzo dużo aplikacji i programów, korzystających z technologii OCR. Możecie je pobrać zarówno na licencji komercyjnej, jak i bezpłatnej. Różnią się od siebie również skutecznością w rozpoznawaniu tekstu, a także dostępnością do dodatkowych funkcji. To, na które rozwiązanie się zdecydujecie, zależy przede wszystkim od Waszych potrzeb, oczekiwań, a także możliwości finansowych.

Darmowe programy OCR

Chociaż różne aplikacje mobilne i programy korzystają z technologii OCR, to nie wszystkie przydadzą się w pracy Tłumacza. Najważniejszą funkcją powinno być nie tylko rozpoznawanie tekstu, ale przede wszystkim możliwość jego szybkiego skopiowania do edytora tekstowego. Z tego powodu odpada m.in. aplikacja Tłumacza Google, która chociaż dobrze sobie radzi z odczytaniem znaków na grafice, to jednak ich przeniesienie w inne miejsce wymaga wielu operacji.

Z punktu widzenia tłumaczeń, o wiele wygodniejsze będą rozwiązania dostępne na komputery stacjonarne lub działające na dedykowanych stronach internetowych. Istnieje szereg darmowych programów OCR, które można z powodzeniem wykorzystywać w codziennej pracy. 

Program OCR online – LightPDF

LightPDF to program OCR dostępny wyłącznie online. Wbrew swojej nazwie, zapewnia możliwość odczytywania nie tylko plików w formacie .pdf, ale również grafiki i zdjęć zapisanych w formatach .jpg i .png. Obsługuje wiele języków, co poprawia skuteczność funkcji rozpoznawania znaków. Co ciekawe, chociaż jest to darmowe narzędzie, to nie wyświetlają się żadne reklamy, poprawiając komfort pracy.

Program LightPDF dostępny jest także w wersji płatnej. Po wykupieniu licencji, otrzymacie dostęp do kilku innych możliwości. Przede wszystkim dotyczących formatów zapisu odczytanego tekstu. O ile darmowa wersja pozwala wyłącznie na zapis do plików .txt, o tyle płatna wersja rozszerza te możliwości do kilku innych formatów, np. .doc, .docx czy .rtf.

OCR.Space – darmowy program OCR

Kolejnym bezpłatnym programem OCR jest OCR.Space, również dostępny online. Umożliwia zarówno załadowanie pliku z komputera, jak i wklejenie adresu URL w celu rozpoznania znaków. Potrafi odczytać tekst na obrazie z plików takich, jak: .jpg, .png i .pdf. Obsługuje 20 języków, w tym polski, chiński, chiński uproszczony, chorwacki itp. Jedyne ograniczenie dotyczy wielkości plików, które nie mogą przekroczyć 5 MB.

Duże możliwości konwertera i2OCR

Powyższe programy OCR umożliwiają odczytanie tekstu z obrazu zapisanego w formatach .jpg, .png lub .pdf. Konwerter i2OCR daje znacznie większe możliwości, oferując możliwość odczytania takich dodatkowych formatów, jak: .bmp, .tif, .ppm oraz .pgm. Rozpoznane znaki możecie zapisywać do plików .pdf, .txt oraz .doc i .docx. Ciekawy jest fakt, że podczas przeglądania nierozpoznanych słów, program wyświetla jednocześnie rozpoznany tekst i źródło. Możecie tym samym wprowadzać ręczną korektę błędnie odczytanych słów.

FreeOCR.net – stacjonarny program OCR

Jeżeli chcecie mieć program OCR zainstalowany na dysku, to warto pobrać darmowe rozwiązanie FreeOCR.net. Korzystanie z niego nie wymaga dostępu do Internetu, a co więcej – jest całkowicie bezpłatne, również do użytku komercyjnego. Bez problemu odczytuje pliki .pdf, .jpg oraz .png, rozpoznając tekst i zapisując do formatów .doc, .docx, .txt, a także .rtf. Program radzi sobie z następującymi językami: polski, angielski, duński, niemiecki, fiński, francuski, włoski, holenderski, norweski, hiszpański i szwedzki.

FineReader – kompleksowa praca z PDF

ABBYY Fine Reader to coś więcej, niż tylko program OCR. Jest to kompleksowe rozwiązanie, które umożliwi Wam pracę z plikami .pdf. Chociaż jest to płatne narzędzie, to zdecydowanie warte inwestycji. Umożliwia zamianę obrazu w tekst, edycję plików PDF, w tym tak problematycznych elementów, jak tabele czy pola tekstowe. Decydując się na FineReader, już otrzymacie w zamian mnóstwo funkcji, które przydadzą się w codziennej pracy Tłumacza.

Adobe Reader z funkcją OCR

Oprogramowanie Adobe Reader jest podstawowym narzędziem do odczytywania plików .pdf. Wykupując jednak płatną licencję, otrzymacie dostęp do wielu innych funkcji, takich jak edycję otwartych plików, w tym możliwość modyfikowania tabel oraz pól tekstowych. Zyskacie również opcję rozpoznawania tekstu na obrazie, w oparciu o bardzo precyzyjną technologię OCR. Wszystkie te możliwości sprawiają, że płatna wersja Adobe Reader jest kompleksowym rozwiązaniem, które z powodzeniem możecie wykorzystać w swojej codziennej pracy.

Aplikacje mobilne z funkcją OCR

Technologia OCR jest dostępna nie tylko w programach online i stacjonarnych, ale również w aplikacjach mobilnych. W sklepie Google Play oraz na AppStore znajdziecie szereg rozwiązań, które mogą pełnić funkcję skanera z opcją rozpoznawania tekstu na obrazie. Pobranie tego typu narzędzia na swojego smartfona daje jeszcze jedną dodatkową korzyść – może przydać się Wam podczas pobytu w kraju, którego pisowni nie znacie.

TextGrabber Offline Scan & Translate Photo to Text

Jedną z najlepszych tego typu aplikacji jest TextGrabber. Dostępna jest bezpłatnie na urządzenia z systemem Android oraz iOS, oferując bardzo wysoką skuteczność rozpoznawania znaków. Cechą szczególną jest fakt, że aplikacja działa offline, możecie z niej więc korzystać w miejscach, w których nie ma dostępu do Internetu. Dodatkową opcją jest możliwość maszynowego przetłumaczenia rozpoznanego tekstu. Fakt ten z jednej strony ułatwi pracę związaną z tłumaczeniem, a z drugiej strony umożliwi zrozumienie napisów podczas pobytu za granicą – np. w Chinach lub w Tajlandii.

CamScanner – mobilny skaner z funkcją OCR

Użytkownicy smartfonów wysoko oceniają także aplikację CamScanner. Przede wszystkim za prostotę w obsłudze, a także precyzyjną technologię OCR. Posiada jednak dosyć poważne ograniczenie – pozwala na odczytywanie tekstów wyłącznie z zamkniętych plików .pdf. Zapisywanie wyniku pracy również możliwe jest wyłącznie w tym formacie. Umożliwia za to poprawianie jakości skanów, a także organizację i wyszukiwanie zapisanych dokumentów.

Office Lens – program OCR od Microsoftu

Microsoft Office Lens jest aplikacją mobilną, która oferuje bardzo wiele możliwości. Pełni funkcję nie tylko mobilnego skanera dokumentów, ale również wykorzystuje technologię OCR do odczytu tekstu na obrazie. Pliki możecie zapisywać do formatu WORD lub PowerPoint, a także przesyłać na swój dysk OneDrive lub do programu OneNote. Aplikację wyróżnia także to, że automatycznie koryguje perspektywę skanu, dzięki czemu skutecznie rozpoznaje znaki niezależnie od kadru grafiki.

Bezpieczne rozpoznawanie tekstu na obrazie

Twórcy wszystkich wymienionych programów i aplikacji gwarantują całkowite bezpieczeństwo dokumentów. W przypadku konwerterów online, pliki usuwane są maksymalnie po upływie godziny. Narzędzia, dające możliwość zapisu dokumentów w chmurze, zapewniają szyfrowane połączenia. Dzięki tym funkcjom zyskujecie pewność, że ważne informacje Klientów nie wyciekną i nie dostaną się w niepowołane ręce.