Wie Scan möglichst kleine Dateigröße?

MAVERICK_

Aktives Mitglied
Thread Starter
Dabei seit
05.05.2005
Beiträge
1.262
Reaktionspunkte
14
Hallo!

Ich habe einen Lexmark X544. Ich scanne Rechnungen ein mit 75 dpi im tiff-Format. Ich komme nicht unter 90 KB.

Rechnungen im PDF-Format von Lieferanten (auch in Farbe!) bekomme ich zum Teil mit lediglich 30 KB.

Deshalb meine Frage: Wie schafft man das? Die Datei nachher nochmals mit einem Tool komprimieren?

LG Christoph
 
Nimm anstatt tiff png oder PDF
Die Dokumente die Du da bekommst sind auch nicht eingescannt.
 
Die Dokumente die Du da bekommst sind auch nicht eingescannt.

Du meinst also, dass sie aus einem Fakturierungsprogramm exportiert werden?

Problem ist, dass ich das tiff-Format brauche, weil ich die Belege auf U-Online lade (Datev; Buchhaltung) und nur tiff-Dateien korrekt ausgelesen werden (OCR-Erkennung).

Als PDF wäre ich jetzt auf 50 kb runtergekommen.
 
Ich will deine Dateien ja nicht noch größer machen, aber die DATEV empfiehlt für Unternehmen-Online 200 oder 300 dpi.

Funktioniert denn das mit 75?
 
Dann musst du eben jeden Scan zweimal durchführen, oder es mit einem Programm im Nachhinein komprimieren. Zweiteres finde ich praktischer.
 
Moment - Du druckst jetzt die Rechnungen aber nicht aus und scannst sie danach wieder ein??
 
Moment - Du druckst jetzt die Rechnungen aber nicht aus und scannst sie danach wieder ein??

Also im konkreten Fall geht es um Eingangsrechnungen, die ich in Papierform bekomme. Diese scanne ich dann ein.

Ich will deine Dateien ja nicht noch größer machen, aber die DATEV empfiehlt für Unternehmen-Online 200 oder 300 dpi.

Funktioniert denn das mit 75?

Ja, die Datev empfiehlt 200 dpi. Wenn ich mit 75 dpi scanne, ist die Datei aber noch sehr gut lesbar.

Welches Programm gäbe es denn für Win, um den Scan nochmals zu komprimieren?
 
Unter Win kann man auch mit IrfanView und dessen Batchkonvertierung gute Ergebnisse erzielen.
 
Hallo,

ein TIFF eines Ursprungsdokumentes im DINA4-Format mit weniger als 50kb? Da müssen schon noch sehr spezielle Komprimierungsverfahren im Spiel sein.

Peter
 
Du könntest noch an der Farbtiere (s/w,grau) herumprobieren, aber erwarte bitte keine Wunder.
Die "fertigen" PDF, die Du bekommst, dürften Vektoren sein oder komprimierte jpg beinhalten.
TIFF ist nicht wirklich für kleine Dateigröße berühmt.
 
Im Internet wird TIFF genutzt, um Anwendern, wie etwa Verlagen, hochaufgelöste Bilder in druckfähiger, verlustfreier Qualität zur Verfügung zu stellen. Dabei wird in Kauf genommen, dass diese Dateien ein Mehrfaches der Größe eines verlustbehaftet komprimierten JPEG-Bildes haben. TIFF hat sich so als Quasi-Standard für Bilder mit hoher Qualität etabliert.
http://de.wikipedia.org/wiki/Tagged_Image_File_Format
 
Nun ja, offenbar besteht die DATEV ja auf TIF, wieso auch immer.

Und wenn ich mich recht erinnere, dann ist die DATEV auch nicht unbedingt für technische Innovationen oder Vorreiter-Rollen in Erscheinung getreten. :)
 
Hmmm; der TE schreibt aber das hier:
Problem ist, dass ich das tiff-Format brauche, weil ich die Belege auf U-Online lade (Datev; Buchhaltung) und nur tiff-Dateien korrekt ausgelesen werden (OCR-Erkennung).

Vielleicht sollte er mal mit der Datev reden was nun Sache ist.

Rein logisch gibt es keinen Grund, wieso OCR mit JPG nicht gehen sollte.
 
Hallo,

doch, doch - es gibt einen guten Grund: TIFF ist ja eben ein Format für unkomprimierte Bilddaten und Zusatzinformationen (z.B. über Farbräume). Deshalb gibt es bei TIFF schärfere Kanten in der Textdarstellung und damit sind solche Scans besser elektronisch zu lesen.

Doch das gilt nur prinzipiell. Inzwischen gibt es auch sehr effektive Komprimierungsverfahren für TIFF - Hausbesetzer hat ja einen dankenswert einen Link zu Wikipedia gepostet. Da kann man alles nachlesen.

Also - ich denke, der TE hat sich schlicht verlesen oder er hat noch Techniken in der Hinterhand, von der wir hier alle nichts wissen.

Peter
 
Sagen wir mal so: in meinem früheren Berufsleben wurde jahrelang auch als TIF gescannt, später dann auf PDF umgestellt und es gab keine Probleme.
Und dort wurden zig und aber zig Tausend Seiten jeden Tag eingescannt, per OCR ausgelesen und in entsprechende Workflows verwandelt.

Und auch ein TIFF ist eine Pixelgrafik. Da mit den scharfen Kanten wage ich dann man tendenziell arg zu bezweifeln. Auch hat ein Farbraum nichts mit Schärfe zu tun.
 
Hallo,

der Farbraum hat nichts mit Schärfe zu tun. Doch ein kleiner Selbstversuch mit TIFF, PNG und JPG bei Vorlagen mit Text zeigt schon den Unterschied: bei JPG verschwimmen die Kanten der Schrift - es sei denn, Du stellst das Komprimierungsverfahren faktisch ab. Ein JPG 100 % Qualität ist ein unkomprimiertes Pixel-Bild und auch genauso groß. Wenn mir jemand sagt, dass ein Dienstleister für die OCR-Verarbeitung TIFF bevorzugt, dann wird das wohl an diesen Zusammenhängen liegen (oder schlicht daran, dass es inzwischen so viele TIFF-Formate gibt). Jedoch gebe ich zu: warum ein Dienstleister ein bestimmtes Format wünscht entzieht sich meiner Kenntnis.

Ein PDF als Ergebnis eines Scan-Vorgangs ist ein Bild in einem Container, also z.B. eine JPG in einem PDF-Container oder was auch immer. In manchen Scan-Programmen kann man das einstellen.

Peter
 
Zurück
Oben Unten