Pokud potřebujete dostat text z nějakého obrázku, případně z PDF dokumentu, pak jste si vybrali správný článek. Dnes vám ukážeme, jak pomocí funkce OCR (optického rozpoznávání znaků) převádět texty z dokumentů, kde je to velmi obtížné.
Pro rozpoznání textu v obrázcích existuje spousta programů. Některé jsou placené, jiné ne. My se dnes podíváme na ty, které své služby poskytují zcela zdarma a vás to tak nebude stát ani korunu. Poslední dobou velkou oblibu získávají online CTR nástroje, které pro vás vytáhnou texty z obrázků zcela zdarma, jenže je tady jisté bezpečnostní riziko, jelikož vaše obrázky musíte nahrát k nim na server.
Které online nástroje použít?
Na internetu najdete opravdu velké množství nástrojů, které umí to, co požadujete. Liší se pouze ve funkcích, které nabízejí, a samozřejmě tím, zda jsou zdarma nebo placené. My se dnes podíváme pouze na ty, které poskytují své služby zcela zdarma.
- Onlineocr.net – Naprosto jednoduchá služba, která vás ohromí svou rychlostí. V prvním kroku nahrajete požadovaný soubor, vyberete jazyk, ve kterém je text napsaný, a zvolíte formát pro výsledný soubor. Během několika vteřin už máte soubor hotový, a to zcela zdarma.
- Newocr.com – Také výborný pomocník, který má na rozdíl od prvního zmíněného jednu funkci navíc. Nemusíte zadávat, v jakém jazyce je text, protože má v sobě zabudovaný Google překladač a udělá to za vás.
- Pdf24.org – Třetí služba, která je zde spíše pro PDF soubory. Samozřejmě zvládne i obrázky, ale pro PDF soubory má několik funkcí navíc. Navíc dokáže po dokončení zachovat strukturu dokumentu, smazat pozadí, nebo dokonce otočit stránku.
Vytáhnout text z obrázku nebo PDF souboru už není nic složitého, a jak sami vidíte, nemusí vás to stát ani korunu a hotovo máte za pár minut.
Zdroj: https://www.techsmith.com/blog/extract-text-from-image/