Imam PDF dokument, ćirilica je u pitanju. Želim da iskopiram tekst.
Select All > Copy > Paste u Word, prenese samo hijeroglife. Obično se ispravno prenesu delovi teksta koji su brojevi, ili neki usamljeni latinični naslov ;)
Adobe Reader > File > Properties > Fonts daje spisak korišćenih fontova: Symbol i TimesNewRoman (embedded subset) su u pitanju, Type: True Type, Encoding: Custom.
Postoji li neko lako zaobilazno rešenje da pokupim tu ćirilicu (a da ne štampam i OCR-ujem)?
Ja sam sebi (još pre par dana) završio posao i zaboravio da se zahvalim za korisan savet, i da potvrdim da je provlačenje tih problematičnih (u smislu kopiranja) PDF dokumenata kroz Abby Finereader rešilo problem.
E sad, da li Abby čita PDF dokument 'iznutra' ili zaista vrši OCR slike- ne znam, a nije ni bitno jer je procenat uspešnosti prepoznavanja valjda 100% zbog toga što je tekst nije skeniran već generisan pa je time i idealan.
Pokušaj sa programom "pdf-Xchange wiever".Odličan PDF čitač,a meni je radio copy/paste ćirilice,naravno ne za sve tekstove ali probaj,trebalo bi da može.Postoji i u portabl verziji.