Text aus einer .PDF Datei kopieren , geht nicht ?!

Critizz

Critizz

Aktives Mitglied
Thread Starter
Dabei seit
28.05.2012
Beiträge
1.136
Reaktionspunkte
22
Hallöchen Community ,

Ich hab ein kleines " problemchen " :

Ich habe eine .PDF Datei im Web gefunden, dessen Inhalt ich gerne kopieren möchte und auf einer .pages Datei wieder einfügen will.
So, ich habe jetzt die .PDF Datei runtergeladen und auch geöffnet.

Wenn ich jetzt den Text auswähle und dann cmd + c drücke, wird der Text auch kopiert.
Wenn ich jetzt aber ein neues Pages Dokument erstelle, kann ich den kopierten Text nicht einfügen. Es passiert einfach nichts.

Kann mir jmd. sagen, was ich falsch gemacht habe ?

Link zur PDF. Datei : http://www.worksheets.de/Felix_Mendelssohn_Bartholdy-Lebenslauf-AB.pdf
 
Dann wird das PDF wohl gegen Herausnahme vom Text gesperrt sein....
 
Gibt es nicht einen Weg, dies zu umgehen ?
 
Der Urrechtheber des Dokuments fragen?
Der wird das nicht für nichts so im Netz publiziert haben.
 
Die Datei zu entsperren wenn du das Passwort hast...

Aber es gibt schon einen Trick.

Scanne das Dokument, lass es in Acrobat Professionell OCR lesen und kopiere den Text dann..

Oder sich mal hier http://www.kreativerunterricht.de genauer umschauen
 
Bei diesem Dokument ist es kein Problem der Sicherheit, dort ist alles freigegeben. Es scheint ein Problem mit der Textcodierung zu sein, nicht mal Acrobat Pro will den Text exportieren oder ein OCR durchführen. Illustrator wandelt den Text direkt in Outlines.

Das Dokument wurde wohl mit CorelDraw erstellt...

Bleibt nur der Umweg über eine qualitativ hochwertige Bilddatei und anschließendem OCR.
 
nicht mal Acrobat Pro will den Text exportieren oder ein OCR durchführen
Für OCR ist die Codierung doch völlig schnuppe. OCR schaut sich die grafischen Elemente an.
 
Für OCR ist die Codierung doch völlig schnuppe. OCR schaut sich die grafischen Elemente an.

Eigentlich schon, nur beim Original sagte mir Acrobat "Acrobat konnte aus folgendem Grund keine Texterkennung (OCR) für diese Seite durchführen: Diese Seite enthält Text, der gerendert werden kann."

Nach dem Exportieren als Bild war auch die Texterkennung kein Problem mehr. Das PDF ist auf jeden Fall recht merkwürdig codiert, was wohl CorelDraw als Ursache hat.

[edit] Nun konnte Acrobat doch den Taxt direkt exportieren (Datei speichern unter RTF), Copy-Paste ist allerdings wie nicht möglich.
 
Probier es mit PDFPen (wovon es auch ein kostenloses Trial gibt). Damit geht das Kopieren bei mir problemlos, und in TextEdit lässt sich der Text genauso einfügen wie in Pages. Das Layout geht dabei verloren, aber soweit ich verstehe geht es dem TE nur um den reinen Text.
 
Zurück
Oben Unten