Vorschau-App: Probleme mit Umlauten in PDFs

H

hbell

Mitglied
Thread Starter
Dabei seit
07.03.2018
Beiträge
1
Reaktionspunkte
0
Hallo zusammen,
seit einiger Zeit habe ich ein Problem mit der Vorschau-App in MacOS (10.12.6):
Wenn ich ein PDF öffne und darin Text markiere und irgendwo hin kopiere (z.B. in eine Email oder in ein Word-Dokument), dann werden statt der Umlaute (also ä, ö und ü) Zeichen eingefügt, die zwar fast genauso aussehen, sich aber ganz komisch verhalten. Die Pünktchen sind ein wenig zur Seite verschoben und wenn man das Zeichen löschen möchte, merkt man, dass es eigentlich zwei separate Zeichen sind: einmal der normale Buchstabe (also z.B. ein a) und die Pünktchen sind ein eigenes Zeichen - das heißt, man muss auch zwei mal Delete drücken, um das vermeintliche ä komplett zu löschen.
Lästig ist daran v.a., dass die Rechtschreibkorrektur die Worte mit diesen komischen Zeichen auch nicht erkennt und sie daher als falsch unterstreicht.

Hat jemand eine Idee, woran das liegen könnte und wie man es beheben kann?

PS: Ich wollte gerade eine Beispiel-Datei hochladen, aber das Forum lässt keine .docx-Dateien zu.
 
Die Pünktchen sind ein wenig zur Seite verschoben und wenn man das Zeichen löschen möchte, merkt man, dass es eigentlich zwei separate Zeichen sind: einmal der normale Buchstabe (also z.B. ein a) und die Pünktchen sind ein eigenes Zeichen … Hat jemand eine Idee, woran das liegen könnte und wie man es beheben kann?

Das ist mir auch schon passiert. Und zwar mit PDFs, die ich in Acrobat Pro öffnete und aus denen ich Texte herauskopierte. Insofern ist nicht Vorschau der Problemverursacher sondern das PDF-erzeugende Programm – und wie dieses die Codierung der Umlaute vornimmt. Untermauert wird das dadurch, dass von mir selbst erzeugte PDFs aus .indd, .AI oder .docx keine solche korrupten Umlaute erstellen.

Aufgrund der Zusammensetzung dieser Umlaute aus 2 Zeichen konnte ich diese Fehler nur manuell beheben.
 
  • Gefällt mir
Reaktionen: dg2rbf
Wie freucom schon angedeutet hat wird das sehr wahrscheinlich an den pdf-Dateien liegen. Es gibt leider genügend Programme, die auch heute noch Umlaute und ähnliche Zeichen in pdf-Dateien aus zwei verschiedenen Zeichen zusammensetzen. Das ist an sich auch kein Problem, wenn das Dokument nur gelesen oder gedruckt werden sollen, macht aber natürlich beim Kopieren von Textteilen Probleme.
Einen einfachen Weg dieses Problem unkompliziert zu lösen, kenne ich leider nicht. Am einfachsten wäre vermutlich noch das pdf automatisiert in Bilder zu rastern (mit genügend hoher Auflösung) und dann eine ocr-Software drüberlaufen zu lassen, die dann Umläute usw. korrekt erkennt. Das Ergebnis kann man dann zum Kopieren nutzen. Schön ist das allerdings nicht.
 
  • Gefällt mir
Reaktionen: dg2rbf und freucom
Es gibt leider genügend Programme, die auch heute noch Umlaute und ähnliche Zeichen in pdf-Dateien aus zwei verschiedenen Zeichen zusammensetzen.
Naja, Unicode sieht ja durchaus die Zusammensetzung von Zeichen vor.

Falls also der PDF-Erzeuger das im Textprogramm innerhalb einer Dokumentdatei getippte monolithische ä in die Sequenz a+¨ auflöst (falls das nicht längst intern im Textprogramm selbst erfolgt ist), macht dér nix falsch.
Zur Überführung in eine der Normalformen führt man folgende Schritte durch:
Im ersten Schritt wird die Zeichenkette vollständig zerlegt: Zu jedem Zeichen wird ermittelt, ob eine Zerlegung existiert, und es wird gegebenenfalls durch diese ersetzt. …

Kann also bedeuten, dass es auch das Problem z.B. der Zwischenablage und/oder letztendlich des entgegennehmenden Programms sein kann, wenn das nunmehr als Zeichenfolge vorliegende ä nicht (also komplett getrennt) oder nicht korrekt (Pünktchen so halb drüber) dargestellt wird.

M.a.W., alles könnte Bestens sein, wenn alle Parteien die Standards einhalten würden.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: dg2rbf und Schiffversenker
Wenn die Software/der PDF-Erzeuger denn überhaupt Unicode verwendet und nicht einfach nur irgendeine simple Kodierung benutzt, bei der „Sonderfälle“ wie Umlaute einfach irgendwie dazugestümpert wurden. Dem Fall bin ich zumindest bisher wesentlich häufiger begegnet.
 
  • Gefällt mir
Reaktionen: dg2rbf
Die Vorschau-App findet keinen Text mit Umlauten in PDF-Dateien.
macOS 13.3.1

Eine Idee wie ich das wieder gelöst bekomme?
 
Hi,
Da hilft nur, auf ein Update von Apple zu warten.
Franz
 
  • Gefällt mir
Reaktionen: KOJOTE
da gabs schon mal einen Thread
 
Safari hat ebenfalls gerade gez(w)ickt. ;)
 
Zurück
Oben Unten