OCR - Dokument soll erhalten bleiben!

Dieses Thema im Forum "Andere" wurde erstellt von TheMagnificent, 26.03.2006.

  1. TheMagnificent

    TheMagnificent Thread Starter MacUser Mitglied

    Beiträge:
    411
    Zustimmungen:
    0
    MacUser seit:
    16.11.2004
    Folgendes Szenario:

    Ich habe etwa 5.000 Seiten über einen Duplex-Scanner eingescannt. Die einzelnen Dateien sind als PDF gespeichert. Leider hat der Scanner (genauer der Kopierer - Sharp AR-M236) keine Texterkennung.

    Wenn ich nun ein Programm wie Readiris 11.0.4 benutze, um eine Texterkennung drüberlaufen zu lassen um so aus den PDFs durchsuchbare Dateien erstellen zu können, wird zwar ein neues Textdokument erstellt - jedoch wird nur der erkennbare Text in das neue Dokument übernommen. Es werden also die übrigen - nicht OCR-erkennbaren Teile - ausgelassen.

    Wie kann ich das ändern? Das Programm soll das "Ur-Dokument" erhalten, aber eben nur den erkennbaren Text als solchen durchsuchbar machen.

    Wenn ich z.B. mit meinem Canon LiDE 50 irgendwelche Seiten einscanne, werde hieraus automatisch Dokumente erstellt, welche 1:1 mit dem Original übereinstimmen, aber trotzdem durchsuchbar sind. Nur möchte ich ungern 5.000 Seiten per Hand einscannen.

    Jemand eine Idee? Danke im Voraus. ;)
     
  2. TheMagnificent

    TheMagnificent Thread Starter MacUser Mitglied

    Beiträge:
    411
    Zustimmungen:
    0
    MacUser seit:
    16.11.2004
    Falls das mal irgendwann jemanden interessieren sollte: Mit dem Acrobat Professional 7.0 klappt das einwandfrei. Es dauert zwar etwas länger, scheint aber zu funktionieren. :D
     
  3. peterpan56us

    peterpan56us MacUser Mitglied

    Beiträge:
    54
    Zustimmungen:
    2
    MacUser seit:
    07.06.2005
    Ocr

    Ich hab erst heute Posting gelesen. Weiss also nicht, ob Du mit Readiris schon weiter bist. Wen nich mich recht erinnerne gibts bei den Einstellungen ein Option Text - Bild / Bild - Text. Das bewirkt dann, dass die gescannte Seite im Vordergrund, der erkannt Text im Hintergrund in einem separaten Layer liegt. Klappt eigentlich sehr gut und schnell, ist nur in der Pro-Version nicht Batch-fähig. Wie machst Du das mit Adobe? Ich hab eine Reihe von Docs gescannt und dann über eine Batch-Prozedur erkennen lassen. Lader gibts ne ganz Reihe von Fehlermeldungen. Warum OCR einige Seiten einfach nicht erkennt, ist nicht nachvollziehbar. Hast Du einen speziellen Workflow?

    Viele Grüße
    Frank
     
Die Seite wird geladen...
Ähnliche Themen - OCR Dokument soll
  1. anfaengerulli

    OCR Software für mac

    anfaengerulli, 14.03.2015, im Forum: Andere
    Antworten:
    11
    Aufrufe:
    1.192
    anfaengerulli
    20.03.2015
  2. Ronny84

    OCR Programm gesucht

    Ronny84, 16.04.2013, im Forum: Andere
    Antworten:
    9
    Aufrufe:
    776
    Frank80
    19.04.2013
  3. iPod90
    Antworten:
    24
    Aufrufe:
    2.506
    Master Pod
    08.05.2011
  4. zerosub
    Antworten:
    1
    Aufrufe:
    1.226
    pseudogc
    04.07.2009
  5. Harmony_Mac

    Freie OCR Software GOCR

    Harmony_Mac, 26.10.2007, im Forum: Andere
    Antworten:
    0
    Aufrufe:
    755
    Harmony_Mac
    26.10.2007