Sharptype
Aktives Mitglied
Thread Starter
- Dabei seit
- 23.05.2015
- Beiträge
- 1.186
- Reaktionspunkte
- 112
Moin zusammen,
nicht lachen, aber bin gerade etwas lost bei einem Thema . Ich scanne mit meinem Scansnap S1300i Dokumente ein, die ich dann als PDF speichere. Als durchsuchbare PDFs habe ich diese nie gespeichert (glaube die Fujitsu Software kann das aber), da ich dachte, dass dann die PDFs selbst durch die OCR neu gestaltet/verändert werden und die hinterher nur so gut dargestellt werden, wie die OCR Software halt übersetzen kann. Das ist völliger Quatsch oder?
Ich habe dann durch Zufall (hatte mich länger mit dem Thema nicht beschäftigt und alles nur normal als nicht durchsuchbares PDF gescannt) mitbekommen, dass es lediglich beim Konvertieren in ein durchsuchbares PDF eine separate Textebene im PDF-Dokument gibt, die aber eben nur zusätzlich enthalten ist, aber es wird nie das eigentlich Dokument geändert? Stimmt das?
Also selbst wenn die OCR schlecht ist, hätte man wenigstens noch die Möglichkeit was schlechtes zu durchsuchen und somit die Chance auf paar wenige inhaltliche Treffer, als gar keine, weil es nicht durchsuchbar ist?
nicht lachen, aber bin gerade etwas lost bei einem Thema . Ich scanne mit meinem Scansnap S1300i Dokumente ein, die ich dann als PDF speichere. Als durchsuchbare PDFs habe ich diese nie gespeichert (glaube die Fujitsu Software kann das aber), da ich dachte, dass dann die PDFs selbst durch die OCR neu gestaltet/verändert werden und die hinterher nur so gut dargestellt werden, wie die OCR Software halt übersetzen kann. Das ist völliger Quatsch oder?
Ich habe dann durch Zufall (hatte mich länger mit dem Thema nicht beschäftigt und alles nur normal als nicht durchsuchbares PDF gescannt) mitbekommen, dass es lediglich beim Konvertieren in ein durchsuchbares PDF eine separate Textebene im PDF-Dokument gibt, die aber eben nur zusätzlich enthalten ist, aber es wird nie das eigentlich Dokument geändert? Stimmt das?
Also selbst wenn die OCR schlecht ist, hätte man wenigstens noch die Möglichkeit was schlechtes zu durchsuchen und somit die Chance auf paar wenige inhaltliche Treffer, als gar keine, weil es nicht durchsuchbar ist?