Zprávy

Dropbox obsahuje textové vyhledávání v pdf dokumentech a obrázcích

Obsah:

Anonim

Podruhé za pouhé dva měsíce vylepšil Dropbox svůj vyhledávací systém tak, aby nyní mohl vyhledávat text v dokumentech PDF a dokonce i obrazové soubory jako PNG nebo JPG.

Dropbox: najděte, co chcete, kam chcete

Zdá se, že toto je předpoklad Dropboxu, populární platformy cloudového úložiště, které se v posledních měsících zaměřilo na zlepšení svého vyhledávacího systému. Minulý měsíc společnost uvedla na trh nový vyhledávací stroj založený na strojovém učení a nyní oznamuje, že vylepšuje možnosti optického rozpoznávání znaků (OCR), které uživatelům umožňují hledat text v PDF i obrazových souborech.

„Formáty obrázků (jako jsou JPEG, PNG nebo GIF) nejsou obecně indexovatelné, protože nemají textový obsah, zatímco textové formáty dokumentů (jako TXT, DOCX nebo HTML) jsou obecně indexovatelné. Soubory PDF zůstávají uprostřed, protože mohou obsahovat kombinaci textového a obrazového obsahu. Automatické rozpoznávání textu obrazu dokáže inteligentně rozlišit mezi všemi těmito dokumenty a roztřídit tak data, která obsahuje.

Navzdory dobrým zprávám je toto nové zlepšení zatím omezeno ze dvou hledisek. Na jedné straně se zdá, že je omezen na anglický jazyk:

Když tedy uživatel provede anglické textové vyhledávání, které se objeví v jednom z těchto souborů, zobrazí se ve výsledcích vyhledávání.

Na druhou stranu, jak Jon Porter shromažďuje v The Verge, funkce je omezena na nejdražší úrovně předplatného.

Nová funkce je nyní k dispozici uživatelům Dropbox Business Advanced a Enterprise a měla by být v příštích měsících dostupná profesionálním předplatitelům Dropboxu.

Operace je podobná technologii, která byla implementována v mobilní aplikaci Dropbox minulý rok: pomocí aplikace vyfotografovat dokument, ale spuštěním OCR současně extrahovat text. To však fungovalo pouze s malou podskupinou dokumentů.

Implementací funkcí OCR přímo do vyhledávače je Dropbox nyní schopen vyhledávat text ve všech vašich souborech PDF a obrázcích bez ohledu na to, jak byly naskenovány nebo vyfotografovány.

DropboxOverové písmo

Zprávy

Výběr redakce

Back to top button