Co je to OCR a k čemu slouží?
Zkratka OCR (Optical Character Recognition) označuje technologii pro optické rozpoznávání znaků. Zjednodušeně řečeno – je to umělá inteligence, která se "podívá" na fotografii, screenshot nebo naskenovaný PDF dokument, najde na něm písmena a slova, a přepíše je do normálního textového formátu, který můžete zkopírovat, upravovat ve Wordu nebo poslat e-mailem.
Nejčastější využití v praxi
- Pro studenty: Máte vyfocenou stránku ze sešitu nebo skript od spolužáka? Nemusíte ji zdlouhavě přepisovat na klávesnici.
- Pro účetní a podnikatele: Vytažení údajů (IČO, čísel účtů, adres) ze starých papírových faktur nebo vizitek.
- Pro programátory: Zkopírování chybové hlášky, která vyskočila v okně, ze kterého nejde text běžně označit myší.
Bezpečnost a zpracování dat
Většina aplikací na převod fotky na text vyžaduje nahrání vašeho souboru na servery třetích stran, což představuje obrovské riziko pro citlivé smlouvy a doklady. Náš nástroj využívá špičkovou knihovnu Tesseract.js, kterou původně vyvinula společnost Hewlett-Packard a dnes ji spravuje Google.
Celé čtení a rozpoznávání textu probíhá uvnitř vašeho prohlížeče pomocí výkonu vašeho zařízení. Nástroj si při prvním spuštění pouze stáhne tzv. "Jazykový model" (slovník pro češtinu/angličtinu), ale vaše fotografie zůstává celou dobu v bezpečí vašeho počítače.