pdf Vorschau - unnötige Zeichen beim Text kopieren in PowerPoint

reiang

Registriert
Thread Starter
Dabei seit
29.05.2012
Beiträge
3
Reaktionspunkte
0
Hallo zusammen,

ich habe ein Problem beim Kopieren von Text aus der pdf-Vorschau in PowerPoint, vielleicht kann mir jemand dabei helfen :) :

Ich möchte Text aus einem pdf, das mit dem Programm Vorschau geöffnet wird, in PowerPoint kopieren.
Merkwürdigerweise wird der Text so in PowerPoint übertragen

In␣ der␣ Praxis␣ ist␣ die␣ Kenntnis␣ hierüber␣ jedoch␣ nur␣ dann␣von␣Vorteil,␣wenn␣man␣ein␣Partnerprogramm␣in␣Eigenregie␣programmieren␣(lassen)␣ möchte.␣ Nutzt␣ man␣ Affiliate␣Netzwerkbetreiber,␣ so␣ ist␣ man␣ auf␣ dessen␣ Technologie␣ fest␣ gelegt.

Weiß jemand, was ich wo einstellen kann, damit mir dieses "␣" nicht mitkopiert wird?
Ich habe schon in den PowerPoint- und Vorschau-Einstellungen geschaut, aber nichts hilfreiches gefunden.
Ist ziemlich lästig, da mich das momentan manuell rauslöschen muss ...

Hatte jemand auch schon mal dieses Problem oder kann mir hier weiterhelfen?
 
Ohne das betreffende PDF kann ich nur Vermutungen anstellen.
Probier mal, den Text nach dem Kopieren in z.B. TextEdit zu kopieren.
Wie sieht es dann aus?
 
In PDF kann man Zeichen beliebig umdefinieren.
Man sagt z.B "Ich benutze Helvetica, aber ein 'a' ist ab sofort ein 'z'".

Meine Bank macht das z.B bei den elektronischen Abrechnungen so.
Ich habe ein komplettes Wochenende damit verbracht den PDF Standard zu lesen und zu verstehen wie sie das machen.
Mir war das dann aber alles etwas zu viel.

Zumal die Zeichen nicht einmal in der Reihenfolge des Textes im PDF stehen müssen, sondern im Prinzip
auch ein "Male hier ein 'a' und da drüben bitte auch" im PDF stehen kann.

Das macht Texterkennung ziemlich kompliziert, da man ein bisschen Layout Information mit analysieren muss.

Code:
40 0 obj
<</Type/Encoding
/Differences[
 64/space 74/Adieresis/period 77/parenleft 92/asterisk/parenright 96/hyphen/slash 107/comma/percent 122/colon 124/section 127/quotedbl 129/a/b/c
/d/e/f/g/h/i 146/k/l/m/n/o/p 153/r 161/germandbls/s/t
/u/v/w 169/z 192/adieresis/A/B/C/D/E/F/G/H/I 208/udieresis 210/K
/L/M/N/O/P/Q/R 226/S/T/U/V/W/X 233/Z 240/zero/one
/two/three/four/five/six/seven/eight/nine]
>>
endobj

So sieht das zum Beispiel aus. Space wird zu 64 anstatt 32, das 'a' fängt bei 129 an und läuft bis 'i'.
Ich weiss auch nicht wer auf solche Ideen kommt...

Ich wollte das nur mal loswerden, weil ich das auch erst kürzlich entdeckt habe.

Gute Nacht
 
Zuletzt bearbeitet:
Danke für eure Rückmeldungen.

@ hjg: Hab mal getestet den Text vorher in Textedit und Word reinzukopieren, aber die Zeichen bleiben trotzdem?!

@ pmau: Oh je, da schließ ich mich Dir an ;)

Schon merkwürdig, das ist vorher noch nie aufgetreten. Sonst weiß ich mir zu helfen und kann so kleine Problemchen immer relativ leicht lösen, aber hier steh ich wirklich auf dem Schlauch!
 
Und wenn du nach dem Kopieren im Textprogramm das Zeichen über „Suchen und ersetzen“ entfernst?
Obwohl – dann bleibt das Problem des (unregelmäßigen) doppelten Wortabstands.
 
In PP gibt es mehrere Arten einzufügen. Hast du die alle probiert?
Vor allem die Option "unformatiert" einfügen.

Aber der Tip mit suchen und ersetzen geht natürlich auch, es sind Leerzeichen und das "␣".
 
Danke für eure Rückmeldungen.

@ hjg: Hab mal getestet den Text vorher in Textedit und Word reinzukopieren, aber die Zeichen bleiben trotzdem?!

@ pmau: Oh je, da schließ ich mich Dir an ;)

Schon merkwürdig, das ist vorher noch nie aufgetreten. Sonst weiß ich mir zu helfen und kann so kleine Problemchen immer relativ leicht lösen, aber hier steh ich wirklich auf dem Schlauch!

wenn du dein text in textedit reinkopierst und diesen dann als reinen text umwandelst - bleiben die zeichen hier auch bestehen?
 
Hello again,

die verschiedenen Einfügen-Möglichkeiten haben alle leider nicht geklappt, ebenso das Umwandeln in reinen Text in TextEdit.
Aber: das Suchen und Ersetzen hat funktioniert!!
Vielen Dank für den Hinweis! :D

Dann muss ich diesen Trick jetzt immer anwenden, wenn ich Text aus der pdf-Vorschau kopiere?
Ich hatte schon die Hoffnung nur eine Einstellung ändern zu müssen für eine dauerhafte Lösung :eek:
 
Dann muss ich diesen Trick jetzt immer anwenden, wenn ich Text aus der pdf-Vorschau kopiere?
Ich hatte schon die Hoffnung nur eine Einstellung ändern zu müssen für eine dauerhafte Lösung :eek:

Nein, definitiv nicht.
Aber eben halt manchmal...
 
Ja nach Herkunft des PDFs oder dessen Machart können aus der dem PDF zugrundeliegenden Originaldatei verschiedenste Zeichen oder auch Kodierungen entnommen worden sein. Auch ist in Unicode Leerzeichen nicht gleich Leerzeichen: Da gibt es mindestens SPACE, NO-BREAK SPACE, EN-SPACE, EM-SPACE, THIN SPACE, HAIR SPACE und viele andere mehr.

Wenn ich etwa in Word2011 ein ZERO WIDTH SPACE in ein Dokument einfüge (über Word selber geht das nicht, wohl aber über die MacOSX-Zeichenpalette), dann wird dieses Nullweitenleerzeichen aber trotzdem im Dokument gekennzeichnet (sonst wüsste man ja nicht, dass eins da ist):

attachment.php


Die Druckausgabe (hier als PDF) ist von der Bildschirmdarstellung freilich unbetroffen:

attachment.php


Bei einem mit den MacOSX-eigenen PDF-Ressourcen aus einer in Safari angezeigten Webseite gedruckten PDF konnte ich die geschilderten Konflikte beim gewöhnlichen Copy&Paste in eine PP2011-Präsentation übrigens nicht nachvollziehen. Selbst die (im konkreten Falle einfache) Formatierung wurde in plausibler Weise übernommen. Erst recht ist gewöhnlich beim Einfügen des Zwischenspeicherinhalts als 'unformatierter Text' kein besonderes Problem zu erwarten.

Letztlich müsste aber immer der Ersteller des PDF Hinweise über die Machart des Originaldokuments oder des daraus erzeugten PDFs machen können ;)
 

Anhänge

  • Wd2011-Nullweitenleerzeichen.jpg
    Wd2011-Nullweitenleerzeichen.jpg
    61 KB · Aufrufe: 214
  • Wd2011-Vrsch-Nullleerzeichen.jpg
    Wd2011-Vrsch-Nullleerzeichen.jpg
    51,3 KB · Aufrufe: 220
Bei mir wird nach jedem Wort,ein,Comma,eingefügt,wenn,ich,aus,Vorschau,etwas,woanders einfüge oder+ein+plus. Allerdings nur bei PDFs, die mein Mac selber macht über den Drucken-Befehl aus Word 2011. OSX Mavericks. und das aktuelle Word. Aus manchen PDFs, die ich von anderer Quelle (windows) bekomme, klappt das einwandfrei.
Die diversen Erklärungen weiter oben erscheinen teilweise nachvollziehbar, aber die frage ist ja: Das Programm Vorschau kann es ja an sich einwandfrei darstellen, warum dann was anderes in die Zwischenablage reintun und dann die User suchen&ersetzen schicken?
 
Zurück
Oben Unten