Търся информация/упътване как да извлека текст от сканиран документ.
Става дума за материал даден от един от доцентите от университета, който обаче бе предоставен на хартиен носител за ксерокопиране. Колега, разполагащ със скенер, реши да сканира всичките 300 стр. "преписни" от трудовете не чуждестранни преподаватели, за да ни спести главоболието със ксерокопиране на такъв материал за всички 170 човека от потока (само може да си направите колко хартия би се похабила за такова начинание).
НО възниква лек недостатък - самият факт, че хартиеният носител, с който разполагахме е ксерокопие и последващото сканиране намалиха контраста и текстът стана малко труден за четене.
За това търся начин за копиране на текста от PDF-файла направен колегата.
Самият PDF е съставен от изображения (на сканираните страници) и опцията с просто маркиране на текста не дава резултат.
*При нужда мога да предоставя файла, но за сега няма да го правя тъй като ще ми отнеме време качването (170 MB e).