Nicht durchsuchbare PDF

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Der Koalitionsvertrag ist als PDF downloadbar: 177 Seiten.
Leider, wie er ist nicht durchsuchbar und man kann den Text aus ihm nicht kopieren.
Welche Lösung (möglichst kostenlos) bietet die Mac-Welt, um diese Einschränkung aufzuheben?
 
Zuletzt bearbeitet:

walfreiheit

Aktives Mitglied
Registriert
06.06.2004
Beiträge
36.566

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Man könnte es in ein Fachforum verschieben, da es hier ja um eine technische Frage ging, und nicht inhaltlich um die Politik dahinter diskutiert wurde.
Danke genau das ist es: bitte nicht den Inhalt diskutieren nur die Form!
Mein Problem ist erstmal gelöst: ich melde mich wieder wenn ich ein solches nich durchsuchbares dokument vieder bekomme.
Die erste nicht durchsuchbare Version habe ich noch, nur kann ich hier keine PDFs hochladen.
 

walfreiheit

Aktives Mitglied
Registriert
06.06.2004
Beiträge
36.566
Danke genau das ist es: bitte nicht den Inhalt diskutieren nur die Form!
Mein Problem ist erstmal gelöst: ich melde mich wieder wenn ich ein solches nich durchsuchbares dokument vieder bekomme.
Die erste nicht durchsuchbare Version habe ich noch, nur kann ich hier keine PDFs hochladen.
In der Regel liegt sowas daran, dass es sich um Scans handelt, also eigentlich Bilder einzelner Seiten. Dort ist dann kein Text im eigentlichen Sinn vorhanden. Das Stichwort lautet dann OCR.
 

walfreiheit

Aktives Mitglied
Registriert
06.06.2004
Beiträge
36.566
Früher war da Readiris ziemlich berühmt. Ich habe aber schon lange keinen Bedarf mehr dafür, und keine aktuellen Erfahrungen.
 

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Hoho!

wußt Ihr das?
Preview macht das auch!
1638049286243.png

Dann [kopieren][einfügen] und der Text ist perfekt erkannt!

wegen ihrer Neutralitätspflicht gegenüber allen Beteiligten, ist es der Planfeststellungsbehörde nicht möglich, sich während der laufenden Sachprüfung und Entscheidungsfindung zu den Inhalten des Antrags politisch zu äußern oder hierzu (vorzeitig) fachlich Stellung zu beziehen.

Geht doch!

Warum steht dann das?

2021 Update: How to OCR PDF on Mac (Batch PDF OCR)​

PDFs provide a convenient way for sharing documents, lots of people choose to save their files in PDF. Even when you scan a document, the files may be saved in PDF by default. But a scanned PDF or image PDF is just a large image file, in which the PDF text is not searchable, nor indexable — unless you perform OCR on the PDF file.

Macht mein Mojave-Mac mehr, als er dürfte?
 
Zuletzt bearbeitet:

Nicolas1965

Aktives Mitglied
Registriert
07.02.2007
Beiträge
2.750

2021 Update: How to OCR PDF on Mac (Batch PDF OCR)​

PDFs provide a convenient way for sharing documents, lots of people choose to save their files in PDF. Even when you scan a document, the files may be saved in PDF by default. But a scanned PDF or image PDF is just a large image file, in which the PDF text is not searchable, nor indexable — unless you perform OCR on the PDF file.

Macht mein Mojave-Mac mehr, als er dürfte?

Du solltest mal nach diesem fett formatierten Satz online suchen. Dann landest Du bei einem Softwarehersteller, der eine Tryout-Version zum Download anbietet. Das ist dann wohl des Rätsels Lösung.
 

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Hoho!

Macht mein Mojave-Mac mehr, als er dürfte?
Ich habe noch das gefunden:


There is Preview too. If you have a PDF that includes information that looks like text - Preview will do an OCR of the information. There isn't a command to make it happen - I think it happens in the background periodically.

But go ahead and try. Scan an image with text and save it as a PDF. In a day or two text will show up. I think the OCR shows up after the system wide search catalogs the document.


Möglicherweise macht es nicht Preview, sondern Spotlight im Hintergrund?
 

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Ich glaube, ich habe mich geirrt.
Nicht Preview, nicht Spotlight machen das OCR, sondern -automatisch- die Scan-Software der Absenderin!
Sie ist so am PC unbedarft, dass sie sicher kein bewustes OCR damit gemacht hat.
Sie hat mir einfach das gescannte weitergeleitet und siehe da, die Mail kommt mit OCR an!

So erging es wahrscheinlich dem, den ich zitierte auch.
Schade...
 

Nicolas1965

Aktives Mitglied
Registriert
07.02.2007
Beiträge
2.750
Naja, so ungewöhnlich ist das nicht. So hat die Treibersoftware eines Canonscanners schon vor ca. 20 Jahren ganz automatisch durchsuchbare PDFs erstellt. Und bei Dir war halt der Wunsch Vater des Gedanken. ;-)
Jedenfalls konntest Du die Sache aufklären und niemanden muss verwirrt bleiben.
 

RIN67630

Mitglied
Thread Starter
Registriert
13.09.2021
Beiträge
752
Und bei Dir war halt der Wunsch Vater des Gedanken. ;-)
Wäre schön gewesen.
Allerdings habe ich immer noch eine Lösung.
PDF Xchange.exe in der kostenlose Basisversion läuft unter Wine und OCR't perfekt 170 PDF-Seiten in 2 Minuten...
Ich weiß schon, weshalb ich bei Mojave geblieben bin.
 
Oben Unten