Scanner Bild in druchsuchbares PDF umwandeln

Aprozz

Mitglied
Thread Starter
Dabei seit
23.02.2006
Beiträge
49
Reaktionspunkte
2
Hallo

Vielleicht kann mir jemand von euch einen Tipp geben. Ich suchen eine Software mit der ich Bilder vom Scanner (oder auch PDF's) in durchsuchbare PDF's umwandeln kann. Das geht z.B. mit Devonthink dass eben etwas teuer ist. Dazu kommt noch das ich die Verwaltung davon nicht brauche...

Gruss
Aprozz
 
...dazu brauchst du ein program, das die s/w pixel des gescannten Bildes in text konvertiert -> Texterkennung

...welchen scanner, bzw mit welcher software scannst du denn?
 
Suchen nach "OCR"-Software.
Die guten kosten aber alle GELD.
 
Schon, aber soweit ich mich erinnern kann sind das immer irgendwie abgespeckte "light"-Versionen.
 
Ich hab nur im Geschäft einen Scanner und zwar ist er im Kopiergerät integriert: Toshiba 350 irgend was....

Da mach ich dann Scanns und schieb die PDF's auf den Memostick und zu Hause möchte ich die halt durchsuchbar machen.

Für Mac hab ich da eben nur Devonthink gefunden. Evernote könnte auch was sein, jedoch möchte ich mich nicht extra bei einem Internet Dienst anmelden.

Danke schon mal für die Antworten...

Gruss Aprozz
 
Hat jemand vielleicht noch ein paar Programm vorschläge?
Mit denen man einfach den Text in einem Bild/PDF erkennen kann.

Gruss
Aprozz
 
Ich habe zum Beispiel den Canon MP600. Ob der auch eine OCR-Software an Bord hat? Muss ich heute Abend mal in den Einstellungen suchen. Sowas wäre auch für mich oft SEHR hilfreich.

Und ich denke, je besser die Vorlage ist, desto besser funktioniert auch die Erkennung. Kann man eigentlich einstellen, in welches Programm der "konvertieren" soll?

Ist es z.B. möglich eine Steuererklärung, mit ihren Forularen und Tabellen in Excel mittels OCR zu exportieren? :kopfkratz:
 
Außer Fließtext geht eigentlich nichts oder fast nichts.
Einige Hersteller behaupten, dass sie auch Schriftarten und - schnitte erkennen können, aber bei Spalten oder Formularen wird es immer dünner.. mehr als reinen Text habe ich eigentlich nie herausbekommen. Und ohne Nachbearbeitung geht es sowieso nicht, da ist manchmal Abtippen schneller als Nachbearbeiten.
Schon eine minimal schräg eingescannte Vorlage kann das Programm in den Wahnsinn treiben. (Und den Anwender vor dem Bildschirm dann gleich mit dazu...)
 
  • Gefällt mir
Reaktionen: laurooon
Außer Fließtext geht eigentlich nichts oder fast nichts.
Einige Hersteller behaupten, dass sie auch Schriftarten und - schnitte erkennen können, aber bei Spalten oder Formularen wird es immer dünner.. mehr als reinen Text habe ich eigentlich nie herausbekommen. Und ohne Nachbearbeitung geht es sowieso nicht, da ist manchmal Abtippen schneller als Nachbearbeiten.
Schon eine minimal schräg eingescannte Vorlage kann das Programm in den Wahnsinn treiben. (Und den Anwender vor dem Bildschirm dann gleich mit dazu...)

Hm, ja kann ich mir gut vorstellen. War halt mal eine Idee, aber ich erwarte da nicht zuviel. Also was beeinflusst die Genauigkeit der Erkennung? Ich meine:

- Qualität des Scanners
- Qualität der Vorlage (Laserdrucker vs. Tintenstrahl)
- Ausrichtungs des Papiers auf dem Scanner (keine Schräglage)
- Abtastgenauigkeit (dpi)

Stimmt doch oder? :kopfkratz:
 
Schriftgröße, je größer desto besser,
keine Spalten,
keine Unterstreichung,
keine Ligaturen,
keine Linien,
kein farbiges Papier,
keine farbigen Kästchen,
keine gerasterten farbigen Texte,
also im Idealfall eine mit der Schreibmaschine getippte Seite in Courier mit 10 cpi.
 
Schriftgröße, je größer desto besser,
keine Spalten,
keine Unterstreichung,
keine Ligaturen,
keine Linien,
kein farbiges Papier,
keine farbigen Kästchen,
keine gerasterten farbigen Texte,
also im Idealfall eine mit der Schreibmaschine getippte Seite in Courier mit 10 cpi.

Hm, okay das trifft ja leider auf keine der "üblichen Fälle" zu, in denen man sowas braucht. Schade. Aber wer bitte tippt einen Text erst ab, druckt ihn dann und scannt ihn dann wieder ein? :confused:

Und wieviel Promille der User haben schon noch eine Schreibmaschine zu Hause. :noplan:
 
Arbeite mal als Sub eines DTP-Studios, dessen Kunden Verlage für wissenschaftliche, juristiische oder sozialwissenschaftliche Bücher sind. Musste ich "damals" öfters mal machen und da gab es Kistenweise maschinengetippte Seiten.
Die waren dann aber teilweise einfacher in ein Satzprogramm zu packen als die Word-Dokumente so einiger Spezialisten, die NIE kapiert haben, dass die Formatierungen in Word nutzlos zum Setzen sind und sie einfach nur den Text runterschreiben sollten. Da hat einen mehrfach in den Wahnsinn getrieben, wenn mal wieder ein völlig verpfuschtes Word-Dokument ankam.
 
Arbeite mal als Sub eines DTP-Studios, dessen Kunden Verlage für wissenschaftliche, juristiische oder sozialwissenschaftliche Bücher sind. Musste ich "damals" öfters mal machen und da gab es Kistenweise maschinengetippte Seiten.
Die waren dann aber teilweise einfacher in ein Satzprogramm zu packen als die Word-Dokumente so einiger Spezialisten, die NIE kapiert haben, dass die Formatierungen in Word nutzlos zum Setzen sind und sie einfach nur den Text runterschreiben sollten. Da hat einen mehrfach in den Wahnsinn getrieben, wenn mal wieder ein völlig verpfuschtes Word-Dokument ankam.

Okay, es mag hier durchaus noch Einsatzfälle geben, in denen Maschinengeschriebenes Sinn macht.

Doch für den typischen "User@home" doch eher unpraktikabel. Ich hatte halt gehofft, ich könnte damit einige Ausarbeitungen digitalisieren und diese dann manuell durch Kommentare meinerseits zu ergänzen.

Auch hatte ich gehofft ein bestimmte bestimmte Formatvorlagen einscannen zu können und diese dann manuell zu editieren, aber das hatten wir ja schon ausgeschlossen.

Viele Grüße
Laurooon
 
Du kannst ja mal in die Fußstapfen von Ray Kurzweil treten und das alles optimieren.
 
Du kannst ja mal in die Fußstapfen von Ray Kurzweil treten und das alles optimieren.

Ray Kurzweil ist Träger dieser Auszeichnungen bzw. Ehrungen:

1965: ersten Platz in der International Science Fair für seine Erfindung des klassischen Musiksynthesizer
1978: Verleihung des Grace Murray Hopper Award der Association for Computing Machinery. Dieser Preis wird jährlich an vergeben und ist mit 35,000 $ Preisgeld dotiert. Kurzweil gewann ihn für die Erfindung der Kurzweil Reading Machine
1990: Engineer of the Year Preis der Design News
1994: Auszeichnung mit dem Dickson Prize in Science der Carnegie Mellon University, der mit 50.000 $ dotiert ist
1998: Inventor of the Year des Massachusetts Institute of Technology
1999: National Medal of Technology
2000: Telluride Tech Festival Award of Technologie
2001: Lemelon-MIT Prize, der mit 500.000 $ dotiert ist

Raymond Kurzweil ist überdies Träger von 15 Ehrendoktortiteln, die er von verschiedenen Institutionen verliehen bekam.

----------------------------------------------------------------

Alles klar! Morgen hab ich ne Lösung, muss nur mal drüber schlafen! :teeth:
 
Eine seiner herausragenden Leistungen war die Grundlagenforschung zum Thema OCR. :)
 
Hier für die des Englischen mächtig sind, eine kleine Beschreibung wie ich mir das etwa vorstelle.

Nur hab ich eben den Scanner im Geschäft und möchte nicht so viel für die Software ausgeben. Ein paar Test mit der Trail Software haben zu sehr guten Ergebnissen geführt. Muss sagen ich bin zufrieden. Aber 150 $ ist mir zuviel...

Gruss Aprozz
 
Hallo

Vielleicht kann mir jemand von euch einen Tipp geben. Ich suchen eine Software mit der ich Bilder vom Scanner (oder auch PDF's) in durchsuchbare PDF's umwandeln kann.

Das geht mit/ab Acrobat 8 (Vollversion) erstaunlich gut.
 
Zurück
Oben Unten