OCR po polsku — zamień skan na Word (przetestowane narzędzia 2026)
Porównanie narzędzi OCR po polsku: jak wybrać to, które dobrze radzi sobie z polskim tekstem, pismem ręcznym i tabelami.
Stos papierowych dokumentów, które chcesz zamienić na edytowalne pliki Word — to codzienność w szkołach, urzędach i firmach. Technologia OCR (Optical Character Recognition) rozwiązuje ten problem, ale nie każde narzędzie radzi sobie z polskim językiem tak samo dobrze. Oto co sprawdziliśmy.
Co to jest OCR i jak działa?
OCR to technologia komputerowego rozpoznawania tekstu na obrazach, skanach i zdjęciach. Algorytm analizuje kształty znaków i zamienia je na edytowalny tekst. Nowoczesne systemy OCR używają sieci neuronowych i osiągają dokładność powyżej 99% dla drukowanego tekstu w dobrych warunkach.
Dla języka polskiego kluczowa jest obsługa znaków diakrytycznych: ą, ć, ę, ł, ń, ó, ś, ź, ż. Tanie lub słabe narzędzia OCR często gubią te znaki, zamieniając „ł" na „l" lub „ę" na „e". Wynik jest nieużywalny bez żmudnej ręcznej korekty.
Rodzaje dokumentów a dokładność OCR
| Typ dokumentu | Trudność OCR | Uwagi |
|---|---|---|
| Druk komputerowy (PDF, skan) | Niska | Najlepsze wyniki, ponad 99% |
| Druk maszynowy (stare dokumenty) | Niska–średnia | Zależnie od jakości skanu |
| Formularz z wypełnionymi polami | Średnia | OCR musi rozpoznać strukturę |
| Pismo ręczne drukowane | Wysoka | 85–95% dla czytelnego pisma |
| Pismo ręczne kursywa | Bardzo wysoka | 60–80%, wymaga korekty |
| Dokumenty ze zniszczeniami | Bardzo wysoka | Zależy od stopnia uszkodzenia |
Jak przygotować dokument do OCR — żeby wyniki były jak najlepsze?
- Rozdzielczość skanowania — minimum 300 DPI dla dokumentów biurowych, 400–600 DPI dla drobnego druku. Zdjęcie telefonem w dobrym oświetleniu zazwyczaj daje 300–400 DPI.
- Oświetlenie — unikaj cieni i refleksów. Fotografuj przy naturalnym świetle lub równomiernym sztucznym. Unikaj lamp błyskowych.
- Płaski dokument — zagięty lub skrzywiony skan zwiększa liczbę błędów. Dociśnij dokument do szyby skanera.
- Format pliku — PNG i TIFF dają lepsze wyniki niż JPEG (JPEG kompresuje obraz, co może zniekształcać znaki przy drobnym druku).
Porównanie narzędzi OCR po polsku
| Narzędzie | Polskie znaki | Pismo ręczne | Cena | Dane w UE | Eksport Word |
|---|---|---|---|---|---|
| [Claso OCR](/funkcje/ocr-do-word) | Doskonałe | Tak | Abonament szkolny | Tak (PL/EU) | DOCX |
| Google Docs OCR | Dobre | Ograniczone | Bezpłatny | Serwery US | DOCX |
| Adobe Acrobat | Doskonałe | Tak | Drogi abonament | Zależy od ustawień | DOCX |
| ABBYY FineReader | Doskonałe | Doskonałe | Drogi, jednorazowy | EU/US | DOCX |
| Darmowe narzędzia online | Zmienne | Słabe | Bezpłatne | Często poza EU | Ograniczony |
Dla szkół: dlaczego RODO ma znaczenie przy wyborze OCR?
Jeśli skanowane dokumenty zawierają dane osobowe uczniów, pracowników lub rodziców (a protokoły, arkusze ocen i pisma szkolne często zawierają), narzędzie OCR przetwarza te dane jako procesor. Oznacza to obowiązki wynikające z RODO:
- Narzędzie musi być procesorem danych (wymagana umowa powierzenia przetwarzania)
- Dane nie powinny być przetwarzane poza EOG bez odpowiednich zabezpieczeń
- Bezpłatne narzędzia online często nie spełniają tych wymagań
Claso OCR do Word spełnia wymogi RODO: serwery w UE, umowa powierzenia dostępna dla szkół, dane nie są przechowywane po przetworzeniu.
Jak używać OCR w Claso — krok po kroku
- Zaloguj się do panelu Claso (funkcja dostępna dla administratorów szkoły)
- Przejdź do sekcji „OCR do Word"
- Prześlij plik — obsługiwane formaty: JPG, PNG, PDF, TIFF (maks. 25 MB)
- Poczekaj 10–60 sekund na przetworzenie
- Przejrzyj podgląd rozpoznanego tekstu — popraw ewentualne błędy przed pobraniem
- Pobierz plik DOCX — gotowy do edycji w Word lub LibreOffice
Zastosowania OCR w szkole
- Digitalizacja archiwum — stare protokoły z rad pedagogicznych, arkusze ocen sprzed cyfryzacji, pisma urzędowe
- Konwersja materiałów dydaktycznych — zadania z papierowych podręczników do materiałów cyfrowych
- Przetwarzanie prac uczniów — zdjęcia prac ręcznych do systemów sprawdzania
- Formularze i ankiety papierowe — digitalizacja wypełnionych ankiet ewaluacyjnych
- Pisma wychodzące — konwersja wzorów dokumentów przechowywanych tylko w papierze
Ile czasu oszczędza OCR w praktyce?
Ręczne przepisanie dokumentu A4 z 1800 znakami zajmuje ok. 20–30 minut. OCR + korekta błędów: 2–5 minut.
Przy 10 dokumentach miesięcznie: oszczędność 3–4 godzin. Przy 100 dokumentach (digitalizacja archiwum): oszczędność 30–40 godzin.
Dla dyrektorów planujących pełną digitalizację archiwum — to zmiana skali trudności z niemożliwego na wykonalne.
Kiedy OCR nie wystarczy?
OCR zamienia obraz na tekst, ale nie rozumie treści. W przypadku tabel o skomplikowanej strukturze, dokumentów z wieloma kolumnami lub bardzo zniszczonych materiałów — po konwersji warto poświęcić kilka minut na korektę w Wordzie.
👉 Wypróbuj OCR do Word za darmo — dostępny w 14-dniowym trialu Claso.