Scanner zum Scannen von Büchern, OCR-Software usw.

mich würde aber mal interessieren, was da ein Buchscan zB eines 100 Seiten normalen Buches kostet.
steht doch auf der Seite - ca. gute 30€ incl. OCR

1705762770449.jpeg
 
Ich rede von Büchern, die sich mit v.a. soziologischen, politischen und geschichtlichen Themen befassen.

Und da kommt es auf korrekte Texterkennung an, weil ich über die Menge dieser Bücher nach bestimmten Begriffen suchen will.
HAst Du den Link angeklickt und verstanden was da steht?
Es geht nicht um den Inhalt/Thema Deiner Bücher, sondern Layout
 
@micki-mac
Zwar sollte die Nutzung eines dedizierten Scanners und einer OCR-Software auf dem Mac die besseren Ergebnisse ergeben - aber man kann nie wissen (Versuch macht kluch): Es gibt für iOS-Devices die Software vFlat Scan, die mit der Besonderheit von Büchern als Vorlage umgehen kann.
Man könnte einen Monatsbetrag "setzen" und sehen, wie das Ergebnis ist.
Ok, dauert natürlich länger, als einen Stapel Seiten in den ADF zu legen. Aber vielleicht kann das Ergebnis überzeugen.
 
Wenn och das richtig übersehe, dann hat der Scanner keinen ADF …
Nein, hat er nicht. Es geht ja auch gar nicht um diesen bestimmten Scanner. In dem Titel zu diesem Thread ist ja bereits die Möglichkeit eines besser geeigneten Scanners enthalten.

Außerdem habe ich in meinem ersten Post geschrieben: "…was empfehlenswert ist in Bezug auf Scanner und OCR-Software."
 
Ein erster Versuch mit einem Buch, das ich mit einem Fujitsu ScanSnap iX100 ins PDF-Format gescannt habe, war nicht gerade ermutigend. Fürs menschliche Auge war der Scan völlig okay, aber die OCR-Software (Abbyy FineReader, mitgeliefert von Fujitsu, bzw. die Version, die mit DEVONthink geliefert wird), hat indiskutabel viele Fehler bei der Texterkennung.

Danach habe ich einige Seiten mit Adobe Acrobat (Testversion für 7 Tage) einlesen lassen, aber das Ergebnis war nicht wesentlich besser, die Nachbearbeitung eines Buchs von etwa 500 Seiten würde mich nicht Stunden, sondern Tage kosten.

Meine Frage ist nun, ob jemand schon Erfahrung mit so einer Aufgabe hat und was empfehlenswert ist in Bezug auf Scanner und OCR-Software.

PS.: Ich habe vorhin mal bei amazon geguckt, und da wurde ein Scanner (vermutlich inkl. Software) in einer Rezension dafür gelobt, dass er eine Trefferquote von 95% hätte. Das würde bedeuten, dass von 100 Zeichen 5 falsch erkannt sind. Wie lange soll man dann an der Korrektur eines Buches sitzen? Da ist ja Abtippen fast schneller.

Unter "völlig ok" kann ich mir leider nichts konkretes vorstellen. Würde das als "leserlich" bewerten, was nach meiner Erfahrung für OCR viel zu schlecht ist.

Der Scanner ist ob einer fehlenden "anständigen" Zuführung nach meinem ersten Eindruck kaum geeignet.

Der verlinkte Dienstleister bietet doch auch Beratung an. Das würde ich nutzen und mal über die genutzte Auflösung recherchieren.
Du kannst doch sagen, dass Du selbst nicht erfolgreich warst und wissen willst, ob das funktioniert. Evtl. kann man mal einen Teil Deines bereits dekonstruierten Buches hinsenden und prüfen, was raus kommt. 30€ für 100 Seiten (oder vielleicht auch weniger) sollte man evtl. schon setzen, um zu sehen, ob die Sache überhaupt eine Zukunft hat. Evtl. sind weitere Investitionen in einen üblichen Homescanner bei Deinem Anspruch gar nicht sinnvoll.

Und die von mir erwähnte Software würde ich für einen Monatsbeitrag auch noch testen.

Ohne gewisse Experimentierkosten wird es wohl nicht gehen.
Du hast aber angedeutet, dass Du dazu bereit bist.

Ob ein 300-Seiten-Buch aber fehlerfrei zu haben ist?
 
Außerdem habe ich in meinem ersten Post geschrieben: "…was empfehlenswert ist in Bezug auf Scanner und OCR-Software."
Unter #9 hatte ich einen Vorschlag gemacht. Warum findet dieser keine Berücksichtigung? Ich habe genau Deinen Anwendungsfall gehabt.
 
Unter #9 hatte ich einen Vorschlag gemacht. Warum findet dieser keine Berücksichtigung? Ich habe genau Deinen Anwendungsfall gehabt.

Danke für deinen Beitrag.

Über den Scanner epson ds 730n kann ich nichts sagen und ich werde erst in die Hardware investieren, wenn ich das sichere Gefühl habe, dass die Anschaffung sich lohnt.

Die hat nämlich auch mit der Software zu tun: Wenn die Software für meine Zwecke keine ausreichend guten Resultate liefert, nützt mir auch ein besserer Scanner nichts. Und an dem Punkt bin ich noch am Testen. Die von DEVONthink mitgelieferte Software, so viel ist für mich jetzt klar, reicht mir jedenfalls nicht aus, weil sie keine Möglichkeit bietet, das von der OCR produzierte Resultat zu korrigieren. D.h. ich müsste mir mindestens auch Adobe Acrobat anschaffen. Und deren Lizenzbedingung (Abomodell) gefällt mir nicht. Ich habe aber bei einem Freund zufällig gesehen, dass er Acrobat installiert hat. Vielleicht kann ich bei ihm mal damit experimentieren.
 
Der verlinkte Dienstleister bietet doch auch Beratung an. Das würde ich nutzen und mal über die genutzte Auflösung recherchieren.
Du kannst doch sagen, dass Du selbst nicht erfolgreich warst und wissen willst, ob das funktioniert. Evtl. kann man mal einen Teil Deines bereits dekonstruierten Buches hinsenden und prüfen, was raus kommt. 30€ für 100 Seiten (oder vielleicht auch weniger) sollte man evtl. schon setzen, um zu sehen, ob die Sache überhaupt eine Zukunft hat. Evtl. sind weitere Investitionen in einen üblichen Homescanner bei Deinem Anspruch gar nicht sinnvoll.

Den Dienstleister könnte man mal testen, es wäre sicherlich ganz interessant zu sehen, welche Qualität die liefern können. Aber deren Preise kann ich eh nicht für 50 Bücher bezahlen, selbst wenn das Ergebnis gut ist.
 
@micki-mac
Zwar sollte die Nutzung eines dedizierten Scanners und einer OCR-Software auf dem Mac die besseren Ergebnisse ergeben - aber man kann nie wissen (Versuch macht kluch): Es gibt für iOS-Devices die Software vFlat Scan, die mit der Besonderheit von Büchern als Vorlage umgehen kann.
Man könnte einen Monatsbetrag "setzen" und sehen, wie das Ergebnis ist.
Ok, dauert natürlich länger, als einen Stapel Seiten in den ADF zu legen. Aber vielleicht kann das Ergebnis überzeugen.

Wie schon gesagt wurde, für Tausende von Seiten braucht man einen automatischen Blatteinzug.
 
Ein vermutlich letzter Beitrag meinerseits zu diesem Thema:

Wenn Du die Zeit, die Du in die Recherche nach einem Scanner und einer OCR-SOftware ins Umblättern steckst sind bestimmt schon 2.000 Seiten gescannt. Man muss ja nicht alles auf einmal machen.
Ich "lese" gerade einen Kommentar mit ca. 3.000 Seiten. Jeden Tag 10, evtl. auch mal mehr und das Ende der Anstrengung ist absehbar.

Ich habe nix davon, wenn Du mal in ein Monatsabo "investierst". Aus meiner Erfahrung kann ich aber sagen: tut.
Hatte die App für die Kopie einer Bauakte mit mehr als 100 Seiten genutzt und war nach 15 Minuten fertig mit scannen und konnte das Archiv wieder verlassen. Ok, Bücher sind schwieriger. Wenn Du ein iPhone hast, wäre ein Versuch einfach und günstig.

Ich hatte früher auch den Hang, alles perfekt machen zu wollen. Kostet elendiglich viel Zeit, die man u.U. zielführender nutzen kann.
Aber klar, jeder wählt die Arbeitsweise, die er für passend hält. Es soll nur ein Anstoß sein.
Kann ja auch ein fall back sein, falls Du in einigen Wochen immer noch suchst.

Lass uns wissen, bei was Du gelandet bist.
 
Zurück
Oben Unten