Text aus PDF lässt sich nicht kopieren

Tordi

Aktives Mitglied
Thread Starter
Dabei seit
16.07.2007
Beiträge
1.003
Reaktionspunkte
764
Ich habe hier jetzt zum wiederholten Mal das Problem, dass ich den Text aus einem PDF nicht über eine Markierung aus dem Dokument übernehmen kann.
Das Dokument enthält reinen Text. Der Umweg, es über Drucken als PDF oder mit einem PDF->Word-Converter umzuwandeln, bringt auch nichts, es kommen nur sinnlose Sonderzeichen heraus. Hätte dazu jemand eine Idee für mich, wie ich den reinen Text da raus bekomme?
 

Anhänge

  • Bildschirmfoto 2022-08-19 um 14.18.18.jpg
    Bildschirmfoto 2022-08-19 um 14.18.18.jpg
    50 KB · Aufrufe: 125
Sehr wenig Infos... Sicher, dass das PDF nicht eine Grafik enthält? Und mit welchen Programmen arbeitest du da?
 
Welche Infos würden denn benötigt? Das PDF rufe ich mit der Apple Vorschau und mit dem Acrobat Reader auf, in beiden Fällen das gleiche Ergebnis. Das Dokument selbst kann ich aktuell leider noch nicht herzeigen, weil bis Sonntag eine Sperrfrist drauf ist.
 

Anhänge

  • Bildschirmfoto-2022-08-19-um-14.31.15.jpg
    Bildschirmfoto-2022-08-19-um-14.31.15.jpg
    47,1 KB · Aufrufe: 106
Was für eine "Sperrfrist"? Evtl. ist die ja der Grund für dein Problem? ;)
 
  • Gefällt mir
Reaktionen: dg2rbf
Das ist eine Pressemitteilung, deren Inhalt erst zu einem bestimmten Termin veröffentlicht werden darf. So etwas nennt man "Sperrfrist".
Da ich regelmäßig mit solchen Fristen und den zugehörigen PMs arbeite ist mal amtlich, dass das nicht "der Grund für mein Problem 😉" ist.
 
Ich würde das mal durch ein OCR-Programm laufen lassen.
Es hört sich so an, als wäre die Information nicht als Text sondern als Bild hinterlegt.

Programme wie z.B. PDFScanner haben auch oftmals eine OCR-Engine.
 
  • Gefällt mir
Reaktionen: Tordi
Du hast schon einen Thread zu diesem Thema auf. Warum nun der neue?
 
  • Gefällt mir
Reaktionen: dg2rbf
Kann man nicht im Acrobat verfügen, dass man nicht kopieren kann?
 
Screenshot machen, den dann mit Vorschau öffnen. Kann man den Text dann herauskopieren?
 
Ja PDFs lassen sich auch mit einem Kopierschutz für den Text erstellen.
 
Der Username ist ähnlich, aber nicht identisch, scheint also wer anderes zu sein. Oder habe ich einen Thread übersehen?
Könnte sein das ich falsch liege. Nur komisch das dieses Problem in fast gleicher Weise so dicht beieinander auftaucht.
 
Ich würde das mal durch ein OCR-Programm laufen lassen.
Es hört sich so an, als wäre die Information nicht als Text sondern als Bild hinterlegt.

Programme wie z.B. PDFScanner haben auch oftmals eine OCR-Engine.
Vielen Dank, das war (im Gegensatz zu den ganzen Vermutungen und Unterstellungen) hilfreich. Tatsächlich ist der Text wohl als Grafik gespeichert, was auch erklärt, warum ich nicht nach Textstellen im Dokument suchen kann. Mit ein paar schnell ausprobierten OCR-Programmen aus dem App-Store kamen schon ein paar brauchbare Ergebnisse heraus.

Da ich in meinen Texten zum Teil mit Zitaten arbeite, benötige ich diese wortgetreu, da ist copy&paste sehr hilfreich.


Du hast schon einen Thread zu diesem Thema auf. Warum nun der neue?
Das wäre mir neu.

Schön, wenn du das weißt, wir aber nicht. ;)
Das trägt auch nichts zur Sache des grundsätzlichen Problems bei. 😉

Wer sich selbst damit spielen möchte, unter diesem Link kann man eine bereits veröffentlichte PM aus derselben Quelle herunterladen, bei der die identischen "Probleme" bestehen.
 
Man kann doch auch den Text einfach mit dem iPhone vom Bildschirm abscannen. Das OCR-Ergebnis ist bei normalen Texten eigentlich ganz gut.
 
  • Gefällt mir
Reaktionen: Jayway
Ich vermute mal, dass beim erstellen der PDF-Datei ein Fehler unterlaufen ist und die PDF kein Text, sondern eine Grafik vom Text enthält. Die Größe von 2,4 MB könnte dafür ein Hinweis sein. OCR kann dabei wirklich helfen, habe gute Erfahrungen mit PDFScanner gemacht, PDF Expert 3 kann es nun auch.
 
  • Gefällt mir
Reaktionen: dg2rbf
Zurück
Oben Unten