pdf in Vorschau nicht durchsuchbar - unter Linux schon

Zeph

Zeph

Neues Mitglied
Thread Starter
Dabei seit
16.10.2006
Beiträge
13
Reaktionspunkte
0
Hallo zusammen. Ich hab ein pdf im Netz heruntergeladen und würde dieses gerne durchsuchen. Allerdings packt Vorschau das irgendwie nicht. Deshalb wollte ich unter Linux eine OCR durchführen und habe dabei festgestellt, dass sich dieses pdf unter Linux problemlos durchsuchen lässt. Jetzt wüsste ich gerne wie ich das unter Mac OS auch hinbekomme. Ich hab auch schon das gleiche Paper als postscript heruntergeladen und konvertiert - genau das selbe. Das postscript mit Linux konvertiert (ps2pdf in allen möglichen Versionen) ist zwar durchsuchbar, allerdings findet Vorschau nur irgendwelche Hyroglyphen, wie auf dem Bild zu sehen ist. Eigentlich wollte ich exemplarisch nach "assessment" suchen, was definitiv im Text vorhanden ist. Die Datei kann unter hier heruntergeladen werden.
Ich nutze Mac OS 10.7.5.

Bildschirmfoto 2013-11-28 um 18.44.48.jpg
 
also der Link funktioniert schon mal nicht. Was heißt denn "nicht durchsuchbar"? kannst du Text markieren? kannst du Suchen aber nichts finden?
 
gelöscht...

Aber wie bekomme ich den Anhang wieder raus ?
 

Anhänge

  • Bildschirmfoto 2013-11-28 um 18.44.48.jpg
    Bildschirmfoto 2013-11-28 um 18.44.48.jpg
    58,3 KB · Aufrufe: 91
Bei mir funktioniert sowohl der Link sowie das Durchsuchen des PDF nach assessment (direkt in Safari und nach Download in Vorschau). Hab allerdings 10.9.
 
Also unter Mavericks ist das PDF in Vorschau durchsuchbar (assessment) wird auch gefunden.

Die Hyroglyphen sind die Mathematischen Zeichen, die werden bei mir auch nicht erkannt.
 
Das hatte ich auch schon öfter, dass PDFs mit der Vorschau nicht richtig angezeigt werden. Lösung: Adobe Reader installieren, damit klappen dann auch diese widerspenstigen PDFs.
 
@Zeph

Für mich sieht das wie ein Font-Problem aus. Das selbe hatte ich unter 10.8.3, aber nicht bei alle pdf Dateien, nur bei manche. Das Problem hat sich selbst erledigt unter 10.8.5.
Deine Datei sieht bei mir unter 10.9 so aus
Bildschirmfoto 2013-11-28 um 20.05.19.jpg
 
also der Link funktioniert schon mal nicht. Was heißt denn "nicht durchsuchbar"? kannst du Text markieren? kannst du Suchen aber nichts finden?

Du findest die Datei auch, wenn du auf citeseer gehst und nach "The Development of a new flame area combustion model using conditional averaging" suchst. Die Downloadbuttons befinden sich rechts oben in Form eines Dateisymbols.

Ich kann keinen Text markieren. Die Vorschau-Suche an sich ist benutzbar, findet aber nichts. Schlecht, dass sich noch niemand mit 10.7.5 gemeldet hat. Updaten ist keine Option.
 
Mit Snow Leo geht's auch nicht.
Ist aber das erste PDF wo ich sowas habe. Dürfte also am PDF liegen...
 
Bei mir (unter MacOSX-10.6.8) lässt sich in Vorschau-5.0.3 kaum Text in jenem PDF markieren.
Fließtext verweigert sich, Text in den Diagrammen hingegen ist markier- und kopierbar:
VRSCH5-Mark.jpg

Und siehe da: Text aus markierbaren Bereichen lässt sich auch suchen; Text aus nichtmarkierbaren Bereichen offenbar nicht:

VRSCH5-Find.jpg

Das PDF ist wohl absichtlich mindestens vor fahrlässigen Zugriffen geschützt.

EDIT: Gegenprüfung in AdobeReader-10.1.8:
Findet zwar mehr, auch im Fließtext, kennzeichnet die Fundstellen dort mit riesigen Flächen in der Auswahlfarbe. Fundstellen in jenen Diagrammen werden hingegen wortgenau markiert. Überhaupt markieren: Fließtext kann nicht zeilen- oder wortweise markiert werden; stattdessen werden ganze, nicht mal zwingend rechteckige Flächen markiert:

AR10.1.8-markieren.jpg
 
Zurück
Oben Unten