Welches Programm macht aus einem Scan ein durchsuchbares PDF?

Nicolas1965

Aktives Mitglied
Thread Starter
Dabei seit
07.02.2007
Beiträge
5.943
Reaktionspunkte
2.918
Möchte versch. Dinge archivieren und hinterher danach suchen können - ohne Verschlagwortung...

Grüße

Nic
 
  • Gefällt mir
Reaktionen: marco312
dehose hat dir doch im anderen Thread einen Link gesetzt :kopfkratz:
 
  • Gefällt mir
Reaktionen: Nicolas1965
wie schon in deinem ersten fred ;) richtig beantwortet:
spotlight wird textteile - ob ein wort oder ein phrase - in pdfs nur als solche erkennen, wenn sie (nach ansicht des computers!) schrift sind... wenn du etwas einscannst, ist es stets (nach ansicht des computers!) ein bild... dass die doks womoeglich mal mit nem textverarbeitungsprogramm getippt worden sind, ist irrelvant.

der im andern fred genannte ansatz mit schrifterkennungstools ist derzeit (und mE noch eine ganze weile) der praktikableste, um nicht zu sagen der einzig gangbare(!?) weg.

wenn sich dein neuer fred vom alten insofern unterscheidet, dass du mit anderen "dingen" zB Bilder meinst, verhaelt es sich aehnlich: iPhoto-Alben erkennt soptlight anhand der importdaten, gescannt ist ein bild "just another scan".

also:
> Welches Programm macht aus einem Scan ein durchsuchbares PDF?
keins. eine am Rechner direkt von Text zu PDF konvertierte Datei erkennt Spotlight (auch inhaltlich, nicht nur den Dateinamen) - ein ueber den Umweg Scanner von Text zu PDF konvertierte Datei erkennt Spotlight einfach nur als Bild.
Anderslautende Berichte sind mE http://de.wikipedia.org/wiki/CSI-Effekt

Möchte versch. Dinge archivieren und hinterher danach suchen können - ohne Verschlagwortung...
das koennen zzt nur die Jungs vom CSI
 
wenn du acrobat hast, kannst du aus „textbildern“ richtige text-pdfs machen. wenn es dass ist, was du möchtest...
 
acrobat kann ja ocr (aber nicht der reader!) menü dokument>ocr-texterkenneung
 
Die OCR Erkennung in Acrobat dauert unter Umständen sehr lange, je nach Auflösung und Länge der Datei. Auch die Genauigkeit ist recht beschränkt, zumindest war das bisher bei meinen Versuchen das Ergebnis. Es wäre eine Überlegung, ob nicht doch den Daten das eine oder andere Stichwort hinzufügst; mich dünkt das einfacher...:)
Ich denke zudem, dass diese Umwandlung nur in Acrobat Professional möglich ist, Du müsstest es also kaufen. Hier aber schon mal ein Zitat aus der Acrobat-Hilfe:
"Wenn Sie das Ausgabeformat „Formatierter Text und Grafiken“ verwenden, werden die aus Text bestehenden Bitmaps analysiert und durch Wörter und Zeichen ersetzt. Falls nicht genau bestimmt werden kann, welche Ersetzung vorgenommen werden muss, wird das Wort als Problemstelle gekennzeichnet. Problemstellen werden im PDF-Dokument als ursprüngliche Bitmap des Wortes angezeigt, der Text steht jedoch auf einer nicht sichtbaren Ebene hinter der Bitmap des Wortes. So kann das Wort durchsucht werden, obwohl es als Bitmap angezeigt wird. Sie können Problemstellen einfach übernehmen oder mit dem TouchUp-Textwerkzeug korrigieren."
 
ich nutze acrobat nach dem scannen von zeitungsartikeln und bin damit recht zufrieden. Habe die acrobat version von der cs3 im einsatz.
 
:eek: Wie kommt denn das Danke von mir in den ersten Beitrag ? ich habe da weder eines gegeben noch würde es einen Sinn machen :confused::kopfkratz:
 
:eek: Wie kommt denn das Danke von mir in den ersten Beitrag ? ich habe da weder eines gegeben noch würde es einen Sinn machen :confused::kopfkratz:

Da kann ich leider nix dafür. Hab mich auch gewundert. Dachte dann aber, vielleicht quält Dich die gleiche Frage.


So, liebe Gemeinde. Habe mich natürlich nach Euren Beiträgen gestern mit der Sache noch intensiver auseinandergesetzt.

Thema OCR ist mir nicht unbekannt.
Thema Archivsoftware (z.B. DEVONThink) ist mir nicht unbekannt.

Habe gestern auch noch einige Zeit "rumgespielt", Spotlight mal etwas intensiver ausprobiert, zu Devon im Netz recherchiert, etc.

Dann ist mir bei einer Test-Suche in Spotlight, ein Dokument in die Finger gekommen, das habe ich vor mehr als einem Jahr auf einem Canon Farb-Laser-All-in-one an einem Toshi-Notebook mit Standardsoftware/-Treiber gescannt. Und Spotlight hat das wie gesagt gefunden.

Habe dann den Mac-Treiber für meinen Canon Lide50 (läuft unter Rosetta) etwas genauer angesehen. Siehe da, da ist ein Häkchen bei "Durchsuchbare PDF erstellen". Ok, es war hinter einem "Einstellungen-Button" versteckt. Die VErblüffung war groß, den der relativ neue Treiber meines HP Officejet Pro kann das nicht (er kann zwar über LAN scannen und auch PDFs erstellen. Die sind deutlich unschärfer als bei Canon und nicht durchsuchbar).

Gerade habe ich auch ein Probedokument gescannt und gleich in Spotlight gesucht: Da war es! Der HP-Scan wurde - wie erwartet - nicht gefunden.

Also: Selbst wenn nicht dick damit geworben wird, kann es sein, dass der Treiber die PDFs durchsuchbar macht.

Danke für Eure Hilfe.

Nic
 
ich nutze acrobat nach dem scannen von zeitungsartikeln und bin damit recht zufrieden. Habe die acrobat version von der cs3 im einsatz.

Kann man das mit Skripten automatisieren? Ich habe hier nen Ordner mit lauter gescannten pdf's die ich gerne erkannt haben möchte, will am liebsten einfach den derzeitigen Speicherort und Speicherort nach Bearbeitung angeben (Name des Dokuments soll dabei übernommen werden), dann auf Start drücken und nen Kaffee trinken gehen. Geht das?

Wenn ja: wie? Skript selbermachen ist schlecht, das kann ich nicht :confused:

Vielleicht hat ja jemand was passendes, ich bin ja bestimmt nicht der Einzige mit so einem Wunsch :)


Gracie
 
Kann man das mit Skripten automatisieren? Ich habe hier nen Ordner mit lauter gescannten pdf's die ich gerne erkannt haben möchte, will am liebsten einfach den derzeitigen Speicherort und Speicherort nach Bearbeitung angeben (Name des Dokuments soll dabei übernommen werden), dann auf Start drücken und nen Kaffee trinken gehen. Geht das?

Wenn ja: wie? Skript selbermachen ist schlecht, das kann ich nicht :confused:

Vielleicht hat ja jemand was passendes, ich bin ja bestimmt nicht der Einzige mit so einem Wunsch :)


Gracie

würde mich auch interessieren... hat jm ne idee?

schön gruß,

Janson ;)
 
Zurück
Oben Unten