Text aus einer .PDF Datei kopieren , geht nicht ?!

Critizz · 08.06.2014

Hallöchen Community ,

Ich hab ein kleines " problemchen " :

Ich habe eine .PDF Datei im Web gefunden, dessen Inhalt ich gerne kopieren möchte und auf einer .pages Datei wieder einfügen will.
So, ich habe jetzt die .PDF Datei runtergeladen und auch geöffnet.

Wenn ich jetzt den Text auswähle und dann cmd + c drücke, wird der Text auch kopiert.
Wenn ich jetzt aber ein neues Pages Dokument erstelle, kann ich den kopierten Text nicht einfügen. Es passiert einfach nichts.

Kann mir jmd. sagen, was ich falsch gemacht habe ?

Link zur PDF. Datei : http://www.worksheets.de/Felix_Mendelssohn_Bartholdy-Lebenslauf-AB.pdf

avalon · 08.06.2014

Dann wird das PDF wohl gegen Herausnahme vom Text gesperrt sein....

Critizz · 08.06.2014

Gibt es nicht einen Weg, dies zu umgehen ?

Thunderbirds · 08.06.2014

Der Urrechtheber des Dokuments fragen?
Der wird das nicht für nichts so im Netz publiziert haben.

avalon · 08.06.2014

Die Datei zu entsperren wenn du das Passwort hast...

Aber es gibt schon einen Trick.

Scanne das Dokument, lass es in Acrobat Professionell OCR lesen und kopiere den Text dann..

Oder sich mal hier http://www.kreativerunterricht.de genauer umschauen

lostreality · 08.06.2014

Bei diesem Dokument ist es kein Problem der Sicherheit, dort ist alles freigegeben. Es scheint ein Problem mit der Textcodierung zu sein, nicht mal Acrobat Pro will den Text exportieren oder ein OCR durchführen. Illustrator wandelt den Text direkt in Outlines.

Das Dokument wurde wohl mit CorelDraw erstellt...

Bleibt nur der Umweg über eine qualitativ hochwertige Bilddatei und anschließendem OCR.

Schiffversenker · 08.06.2014

nicht mal Acrobat Pro will den Text exportieren oder ein OCR durchführen

Für OCR ist die Codierung doch völlig schnuppe. OCR schaut sich die grafischen Elemente an.

lostreality · 08.06.2014

Schiffversenker schrieb:
Für OCR ist die Codierung doch völlig schnuppe. OCR schaut sich die grafischen Elemente an.

Eigentlich schon, nur beim Original sagte mir Acrobat "Acrobat konnte aus folgendem Grund keine Texterkennung (OCR) für diese Seite durchführen: Diese Seite enthält Text, der gerendert werden kann."

Nach dem Exportieren als Bild war auch die Texterkennung kein Problem mehr. Das PDF ist auf jeden Fall recht merkwürdig codiert, was wohl CorelDraw als Ursache hat.

[edit] Nun konnte Acrobat doch den Taxt direkt exportieren (Datei speichern unter RTF), Copy-Paste ist allerdings wie nicht möglich.

walfrieda · 08.06.2014

Probier es mit PDFPen (wovon es auch ein kostenloses Trial gibt). Damit geht das Kopieren bei mir problemlos, und in TextEdit lässt sich der Text genauso einfügen wie in Pages. Das Layout geht dabei verloren, aber soweit ich verstehe geht es dem TE nur um den reinen Text.

Text aus einer .PDF Datei kopieren , geht nicht ?!

Critizz

Aktives Mitglied

avalon

Aktives Mitglied

Critizz

Aktives Mitglied

Thunderbirds

Aktives Mitglied

avalon

Aktives Mitglied

lostreality

Aktives Mitglied

Schiffversenker

Aktives Mitglied

lostreality

Aktives Mitglied

walfrieda

Aktives Mitglied