Keine Umlaute nach OCR-Erkennung in Acrobat Pro

Davidavid

Davidavid

Aktives Mitglied
Thread Starter
Dabei seit
07.08.2004
Beiträge
661
Reaktionspunkte
40
Hallo Leute,

es gibt ein schon ein paar Threads zum Thema Umlaute und PDFs, aber keinen zu meiner hochinteressanten Frage. :)

Wenn ich per OCR-Erkennung einen gescannten deutschen Text konvertiere (Einstellung German und Searchable Image, Exact), dann werden Umlaute, ß und andere Zeichen mit Codes à la Ã1/4, ö oder  ersetzt. Damit kann man also Wörter, die sowas enthalten nicht über die Suche finden und auch keinen ordentlichen Text kopieren. Die Erkennung englischer Text hat bis jetzt ganz gut funktioniert.

Weiß vielleicht jemand, was man da machen kann? Ich fänd das toll, ist nämlich ein praktisches Feature.
(Acrobat Pro 6.0 english.)


Und PS: Kennt jemand ein kostenloses Tool für Mac bzw. PC, das meinen armen Freunden die Möglichkeit gibt, in meinen konvertierten Dokumenten Markierungen und Kommentare zu machen? Ich habe über Versiontracker etc. nichts vernünftiges gefunden.

Gruß ins beste Forum der Welt,

DD
 
Zuletzt bearbeitet:
Wenn ich übrigens den deutschen Text mit der Einstellung english OCRisiere fallen immerhin die Ã1/4-Auflösungen weg. Stattdessen wird dann ein Ö zum O, ein ü zum u, ein ß zum fi. Mit Sonderzeichen wie » hat Acrobat dann aber immernoch Probleme. (» zu ~, « zu *)
 
Zurück
Oben Unten