Word: Kopieren/Einfügen mit äöü-Problem

Ergebnis

Ergebnis

Aktives Mitglied
Thread Starter
Dabei seit
26.07.2009
Beiträge
1.355
Reaktionspunkte
110
Wenn ich einen Text kopiere (z. B. aus einem PDF) und in Word einfüge, "passen" die Buchstaben äöü nicht - siehe Screenshot. Im muss jedes Mal die Rechtschreibprüfung laufen lassen, um das zu korrigieren.

Der Fehler ist nicht schon immer aufgetreten. Welche Einstellung passt (vermutlich) nicht?

[Als Sprache ist Deutsch (Deutschland) eingestellt, daran liegt es also nicht.]
Ohne Titel.jpeg
 
Wenn ich einen Text kopiere (z. B. aus einem PDF) und in Word einfüge, "passen" die Buchstaben äöü nicht - siehe Screenshot. Im muss jedes Mal die Rechtschreibprüfung laufen lassen, um das zu korrigieren. – Der Fehler ist nicht schon immer aufgetreten. Welche Einstellung passt (vermutlich) nicht? …
Die Fehlerquelle dürfte das Programm / Modul sein, mit dem das jeweilige PDF erzeugt / nachbearbeitet worden ist. Sogar das Acrobat-eigene OCR scheint zuweilen (Vokalzeichen + kombinierbare Dihärese [Unicode CC 88]) – unabhängig von Spracheinstellungen – gegenüber den deutschen Umlauten zu bevorzugen.
Entsprechend kannst Du auf der Empfängerseite wenig tun, allenfalls mit work-arounds arbeiten, wie etwa einer automatisierten Suche nach den Zeichen ä, ö, ü mit Ersatz durch ä, ö, ü.

Tante Edith hat die Zeichen von ihren -ketten befreit. (2018-09-16 08:53)
 
Zuletzt bearbeitet:
Ich vermute aus zwei Gründen, dass es an Word bzw. den Einstellungen dort liegt: a) Es passiert beim Einfügen aus allen PDF. b) Beim Einfügen in LibreOffice (Writer) tritt der Fehler nicht auf.
 
Ich vermute aus zwei Gründen, dass es an Word bzw. den Einstellungen dort liegt: a) Es passiert beim Einfügen aus allen PDF. b) Beim Einfügen in LibreOffice (Writer) tritt der Fehler nicht auf.

Mangels MS-Word kann ich keine sicheren Aussagen machen.

Tatsächlich hat auch Firefox meine Eingaben von Vokalzeichen + "combining diaeresis" in Beitrag #2 automatisch in die Umlaute umgewandelt, ebenso tun dies auch Apple-TextEdit und LibreOffice.
In R.O.M.-Papyrus ist es mir gelungen, die 6 Zeichen getrennt einzugeben, so dass sie wie die 3 Umlaute dargestellt werden, aber beim Durchlauf mit dem Cursor jeweils 2 Schritte erfordern.
Beim Kopieren dieser Zeichenkette in LibreOffice oder das Eingabefeld, in dem ich diesen Beitrag schreibe wird sie dann in die 3 Umlautzeichen gewandelt.
Meine Theorie wäre daher, dass Word, ebenso wie Papyrus, diese Ersetzung (aus Gründen der typographischen Korrektheit) nicht vornimmt.

Insofern bliebe Dir als Ausweg am ehesten, bei PDFs immer den Umweg über TextEdit oder LibreOffice zu nehmen.

Leider kann ich nicht sagen, ob sich in Word in irgendeinem menu, das den Import von ASCII/Unicode betrifft über ein Häkchen ein entsprechender Filter aktivieren lässt.
Vielleicht wird durch unsere Diskussion ja einer der Experten aufmerksam.​
 
  • Gefällt mir
Reaktionen: Ergebnis
Die Fehlerquelle dürfte das Programm / Modul sein, mit dem das jeweilige PDF erzeugt
Genau so ist es. Wurde die PDF mit 3B2 und speziellen 3B2-Schriften erzeugt (was relativ viele Verlage machen, besonders im wissenschaftlichen Bereich), so entsteht das Problem.

Da kannst du als Anwender leider nichts machen, außer den Text nachbearbeiten.
 
  • Gefällt mir
Reaktionen: Ergebnis
Eine Verständnisfrage: Wieso erkennt LibreOffice das korrekt bzw. meldet keinen Fehler, aber Word sieht es als Fehler an?

Es hilft übrigens auch nichts, den Text in LibreOffice einzufügen, abzuspeichern und dann in Word zu öffnen (o. ä.). Der Fehler wird von Word "zuverlässig" erkannt.
 
Das weiß ich leider nicht. Es ist wohl so, wie @tungsten66 schreibt/vermutet. Word importiert das auf eine gewisse Art und Weise.

Bei Wikipedia steht im Eintrag zum Satzsystem 3B2: "3B2 benutzt neben dem alten eigenen Schriftformat (FNT/Typ3) inzwischen auch TrueType- und OpenType-Fonts, basierend auf TrueType und PostScript"

Ich weiß nur, stellt der Satzbetrieb in 3B2 auf die modernern Fonts um, klappt es plötzlich. Word scheint die alte Art der Codierung/Fonts einfach nicht zu unterstützen.

Viele Betriebe stellen aber in Bestandswerken nicht um, da sie minimale Veränderungen in der Laufweite und damit im Umbruch/Seitenumfang fürchten.
 
  • Gefällt mir
Reaktionen: Ergebnis
Meiner Meinung nach ist es ein Fehler in Word. Wikipedia sagt zwar, dass Dihärese und Umlaut verschiedene Dinge sind, aber gleichzeitig steht dort:
umlaut and diaeresis diacritics are identically encoded, e.g. U+00E4 ä LATIN SMALL LETTER A WITH DIAERESIS(HTML ä · ä) represents both a-umlaut and a-diaeresis
Und aus der Unicode-FAQ:
the U+0308 COMBINING DIAERESIS is to be used for diaeresis, trema, umlaut, as well as other, possibly unrelated uses
Demnach stehen U+0308 (mit a) und U+00E4 für das selbe Zeichen, es sind nur unterschiedliche Wege es zu konstruieren. Und deshalb sollte Word ä nicht als Fehler markieren, sondern genau so wie ä behandeln.
 
  • Gefällt mir
Reaktionen: Ergebnis
Es liegt an "Word" und dessen seltsamen Formatierungen.
Kopierte Texte besser vorab einmal als "reinen Text" anlegen und dann in oder aus Word kopieren – immer nach "dem Format-reinwaschen" verwenden etc.
 
  • Gefällt mir
Reaktionen: Ergebnis
Jetzt weiß ich zumindest, dass ich in keinen Word-Einstellungen suchen muss.

Ich habe als nächstes ein großes Skript zu übernehmen, da werde ich das mit dem reinen Text probieren. Für die kleineren scheint mir "Suchen" und "Ersetzen" ein gangbarer Weg zu sein. Ansonsten hoffe ich, dass Microsoft das Problem mal irgendwann bemerkt und behebt.
 
  • Gefällt mir
Reaktionen: dodo4ever
Kopierte Texte besser vorab einmal als "reinen Text" anlegen und dann in oder aus Word kopieren
Es mag auch helfen: Bearbeiten > Einfügen und an Formatierung anpassen (gemeint sind die Formateinstellung am Ziel im Word-Dokument unter Weglassen etwaiger versteckte Formatierungsinfos der Quelle).

Mglw. wird dann ä in ¨a aufgelöst und sieht das Malheur wenigstens.
 
  • Gefällt mir
Reaktionen: Ergebnis
Es hat mir keine Ruhe gelassen und der Hinweis von fa66 hat mich nochmals "basteln" lassen. Es gibt eine Möglichkeit des Einfügens, die den Fehler vermeidet:

Am Button Einfügen gibt es "Inhalte einfügen" und dann Formatierten Text (RTF) einfügen. Diese Art des Einfügens vermeidet die fehlerhafte äöü-Darstellung.
 
  • Gefällt mir
Reaktionen: huberhansi und JeanLuc7
Hab mich schon sehr oft darüber geärgert - der Tip mit Einfügen per RTF klappt super. Vielen Dank
 
  • Gefällt mir
Reaktionen: Ergebnis
Zurück
Oben Unten