TheMagnificent
Mitglied
Thread Starter
- Dabei seit
- 16.11.2004
- Beiträge
- 411
- Reaktionspunkte
- 0
Folgendes Szenario:
Ich habe etwa 5.000 Seiten über einen Duplex-Scanner eingescannt. Die einzelnen Dateien sind als PDF gespeichert. Leider hat der Scanner (genauer der Kopierer - Sharp AR-M236) keine Texterkennung.
Wenn ich nun ein Programm wie Readiris 11.0.4 benutze, um eine Texterkennung drüberlaufen zu lassen um so aus den PDFs durchsuchbare Dateien erstellen zu können, wird zwar ein neues Textdokument erstellt - jedoch wird nur der erkennbare Text in das neue Dokument übernommen. Es werden also die übrigen - nicht OCR-erkennbaren Teile - ausgelassen.
Wie kann ich das ändern? Das Programm soll das "Ur-Dokument" erhalten, aber eben nur den erkennbaren Text als solchen durchsuchbar machen.
Wenn ich z.B. mit meinem Canon LiDE 50 irgendwelche Seiten einscanne, werde hieraus automatisch Dokumente erstellt, welche 1:1 mit dem Original übereinstimmen, aber trotzdem durchsuchbar sind. Nur möchte ich ungern 5.000 Seiten per Hand einscannen.
Jemand eine Idee? Danke im Voraus.
Ich habe etwa 5.000 Seiten über einen Duplex-Scanner eingescannt. Die einzelnen Dateien sind als PDF gespeichert. Leider hat der Scanner (genauer der Kopierer - Sharp AR-M236) keine Texterkennung.
Wenn ich nun ein Programm wie Readiris 11.0.4 benutze, um eine Texterkennung drüberlaufen zu lassen um so aus den PDFs durchsuchbare Dateien erstellen zu können, wird zwar ein neues Textdokument erstellt - jedoch wird nur der erkennbare Text in das neue Dokument übernommen. Es werden also die übrigen - nicht OCR-erkennbaren Teile - ausgelassen.
Wie kann ich das ändern? Das Programm soll das "Ur-Dokument" erhalten, aber eben nur den erkennbaren Text als solchen durchsuchbar machen.
Wenn ich z.B. mit meinem Canon LiDE 50 irgendwelche Seiten einscanne, werde hieraus automatisch Dokumente erstellt, welche 1:1 mit dem Original übereinstimmen, aber trotzdem durchsuchbar sind. Nur möchte ich ungern 5.000 Seiten per Hand einscannen.
Jemand eine Idee? Danke im Voraus.