Dateigröße eine eingescannten PDF-Buches minimieren

S

Simor222

Aktives Mitglied
Thread Starter
Dabei seit
11.12.2015
Beiträge
1.220
Reaktionspunkte
107
Hallo,
ich habe mit einem Brother Dokumentenscanner ein Fachbuch (lose Blätter, ca 500 Seiten ) mit einer Auslösung von 300dpi eingescannt.

Danach dann das PDF Dokument mit PDF Squeezer auf eine lesbare Dateigröße geschrumpft.
Die Datei hat dann noch eine Auflösung von 517 x 723 und ist 151MB groß.

Läßt sich hier noch was optimieren, ohne die Lesbarkeit zu stark zu beeinträchtigen ?

Wie machen das die Verlage, die solche eBooks mit nur wenigen MB Dateigröße anbieten ?

Danke für Hilfe

VG Simor
 
Da sind die Seiten nicht als Bilder gescannt sondern da werden die PDFs von Originaldaten geschrieben, Text bleibt Text und somit ist die Auflösung egal.
Du kannst höchstens schauen ob dein Programm die Scans in Text umwandeln kann.
 
Meinst Du OCR ?
Dann müsste ich aber den gesamten Text in eine Dokumentendatei kopieren und die wiederum in ein PDF wandeln.
 
Wenn’s nicht anders geht dann wohl so, ja.
 
o.k. Danke
 
Hallo,

beim Scan einer Vorlage wird zunächst immer eine Bild-Datei erzeugt und die dann als PDF gespeichert. In die PDF wird das Bild eingebettet. Bei einem Scan mit 300 dpi werden 300 Bildpunkte pro 2,57 cm gescannt. Du kannst nun eingreifen, indem Du die Auflösung verringerst, also weniger dpi pro 2,57 cm. Das hat das Programm Squeezer ja offensichtlich gemacht. Du könntest auch die Kompressionsstufe der erzeugten PDF erhöhen - also z.B. 95 % oder gar 75 %. Ausprobieren. Du kannst das ja mal mit einer beliebigen Vorlage ausprobieren und die Ergebnisse vergleichen.

Peter
 
Eine (teilweise) Umwandlung in Schwarz-Weiß bringt viel (natürlich nicht, wenn viele Bilder mit Farben vorhanden sind).
 
Ich habe schon einige Kompressionsstufen ausprobiert und muß es so lassen, damit es noch gut lesbar bleibt.
Jetzt habe ich den Unterschied zu den kommerziellen PDFs verstanden. Das passt dann so.

Der Umweg über OCR und dann alles in eine Textdatei kopieren macht bei ca. 500 Seiten keinen Sinn.
 
Sind denn da farbige Bilder drin? SW brauchst Du nicht komprimieren, da sind die Dateien schon sehr klein.
 
Ja, es ist ein Fachbuch mit einigen Bildern, Übersichten und der Text ist optisch auch gut integriert.
 
  • Gefällt mir
Reaktionen: Simor222
Für OCR habe ich PDF Scanner.

Dann probiere ich den Quartz-Filter mal aus (y)
 
macOS 12 soll auch text erkennen können...
 
Du brauchst dafür ein gutes PDF-Programm. Ich nutze dafür abby finereader. Der macht direkt OCR und Optimalisierung. Ich scanne immer in schwarz/weiß bei 600 dpi und die Bilder extra in Farbe und setzte die Macher rein. Aber die meisten Bücher die ich scanne haben eh nur Zeichnungen.
 
  • Gefällt mir
Reaktionen: MacKaz
Du brauchst dafür ein gutes PDF-Programm. Ich nutze dafür abby finereader. Der macht direkt OCR und Optimalisierung. Ich scanne immer in schwarz/weiß bei 600 dpi und die Bilder extra in Farbe und setzte die Macher rein. Aber die meisten Bücher die ich scanne haben eh nur Zeichnungen.
Die Bilder am besten nicht mit JPEG komprimieren könnte man noch als Ergänzung hinzunehmen (wobei ich nicht weiß, ab das bei Abby eingestellt werden kann).
Ansonsten genau das, was ich weiter oben auch schon aufgreifen wollte. Will man gute Qualität und kleine Dateien, geht das zwar, aber man muss sich da schon einen Augenblick ransetzen und soweit wie möglich die Seiten (also Text/Bilder) auftrennen.
 
Zurück
Oben Unten