Kann man die Seitenanzahl von mehreren Dokumenten anzeigen lassen?

Chinese

Aktives Mitglied
Thread Starter
Dabei seit
13.07.2014
Beiträge
126
Reaktionspunkte
13
Hallo Mac-Freunde,
gibt es eine Möglichkeit, bei mehreren Text-Dokumenten (PDFs, Docs) in einem Rutsch die Seitenanzahl anzeigen zu lassen?
Es wäre für mich sonst ein Riesenaufwand ca. 5000 Dokumente einzeln abzufragen.
Danke für jede Idee und für jeden Hinweis!

Chinese
 
Nur soweit:
Da müsste es also ein Utility (weswegen du die Frage unter »Utilities und Treiber« platziert hast) geben, das batchweise eine genannte Anzahl Dokumentdateien öffnen (dann wieder schließen) müsste, in die irgendwo im Dokumentkörper hinterlegten Dokumentstatistiken hineinsehen, den Wert für »Seiten« auslesen, um diesen in einer Ausgabedatei für die zuvor spezifizierten Dateien aufzulisten.

Vermutlich nicht unmöglich; es erscheint mir aber zu spezifisch, als dass das bereits vielfach programmiert wäre.

Erschwerend kommt dazu, dass »Seite« in Textverarbeitungsdokumenten ein volatiler Begriff ist: Seite ist »Seite« in Abhängigkeit vom lokal verwendeten Druckertreiber, da kann ein US-Amerikaner bei der kürzeren Lettersize bei ein und demselben Word-Dokument mehr Seiten sehen als der DIN-A4-Restweltler.

Das war’s dann auch schon mit meinem Räsonnieren.
 
Ich dachte, bei PDF wie bei anderen Textformaten gibt man die Seitengröße bereits beim Erstellen an.
Und falls man auf ein anderes Papierformat ausdrucken möchte, muß man das dann umformatieren.
 
Zu PDF habe ich mich nicht geäußert. Da wurde ja bereits ein »Druck« mit dem gewählten Blattformat durchgeführt und im PDF fixiert.

Bei Word-Dokument(format)en kann beim in DE wie »selbstverständlich« auf A4 eingestellten Drucker am US-Ziel immernoch Lettersize als Druckerstandard ausgewählt sein. Darauf hat das Word-Dokument keinen Einfluss. Bei eingebetteten Objekten mag dann noch die Warnung kommen, dass diese im nichtdruckbaren Bereich lägen. Ggf. führt Word selbst eine Neuformatierung durch (früher™ sah man beim Öffnen oft lange in der Statuszeile des Docs den Text »Seitenumbruch wird durchgeführt« währenddessen Word nur zäh reagierte).

Die Frage ist ja auch, was der TE anhand der in Erfahrung gebrachten »Seitenanzahl« ermitteln möchte. Mehr als den Papierbedarf fürs Drucken kann’s irgendwie nicht sein.
 
Interessante Frage. Ich hätte zwar keinen Anwendungsfall für sowas, weil ich für das Administrieren so vieler Dateien dann ein Dokumentenmanagementsystem verwenden würde, das die nötigen Metadaten enthält.

Doch für PDFs hätte ich schonmal den Vorschlag, Dir ein kleines Script schreiben zu lassen, dass aus den Finder-Informationen die Seitenzahl einfach ausliest. Gucksdu!

Bildschirmfoto 2020-08-28 um 21.38.24.png


Ein fertiges Tool fällt mir nicht ein.

Bei Word findest Du die Information unter Datei : Eigenschaften : Statistik ... auch das müsste sich mit einem Progrämmelchen auslesen lassen. Die Seitenzahl ist also in den Dateien hinterlegt. Ich hab mal mit File Viewer in eine Worddatei geguckt. Auf Anhieb hab ich's auch in der Hex-Ansicht nicht gefunden, aber es muss drin stecken. Vielleicht gibt es beim Entwickler eine Information dazu.
 
Die Frage ist ja auch, was der TE anhand der in Erfahrung gebrachten »Seitenanzahl« ermitteln möchte. Mehr als den Papierbedarf fürs Drucken kann’s irgendwie nicht sein.

Er soll für jemanden, der mit Computern nicht so viel am Hut hat, eine Aufstellung machen, wieviele Dokumente eigentlich in der neuen Vorschrift der hiesigen unteren Oberbehörde verarbeitet worden sind. Es kann aber tatsächlich auch ein digitalisierungsprojekt sein: Da stehen acht Meter Leitz-Ordner, die man bei einem Umzug von einer anderen Organisation geerbt hat, aber ohne die Quelldaten und die sollen nun eingescannt und digital zugänglich gemacht werden. Für diese Aufgabe hätte ich dann übrigens jemanden an der Hand, der das schon mit ganz vielen Seiten gemacht hat. Das ist also durchaus vorstellbar.

Ich würde aber die Berechnung von irgendwas nicht an die Seitenzahl knüpfen, weil die ja ganz unterschiedlich voll geschrieben sein können, mal mehr, mal weniger Bilder haben usw. Da würde ich eine andere Berechnungsgrundlage anstreben.
 
Zu PDF habe ich mich nicht geäußert. Da wurde ja bereits ein »Druck« mit dem gewählten Blattformat durchgeführt und im PDF fixiert.
Sorry, das habe ich wohl falsch verstanden - mir war nicht klar, daß das nur auf doc-Dateien bezogen war.
Denn der TE erwähnte als erstes PDF.
Erschwerend kommt dazu, dass »Seite« in Textverarbeitungsdokumenten ein volatiler Begriff ist: Seite ist »Seite« in Abhängigkeit vom lokal verwendeten Druckertreiber, da kann ein US-Amerikaner bei der kürzeren Lettersize bei ein und demselben Word-Dokument mehr Seiten sehen als der DIN-A4-Restweltler.
Und ehrlich gesagt, bezweifle ich diese pauschale Aussage.
Es gibt ziemlich viele Textverarbeitungsprogramme, mit ganz unterschiedlichen Ansätzen.

.
 
Er soll für jemanden, der mit Computern nicht so viel am Hut hat, eine Aufstellung machen, wieviele Dokumente eigentlich in der neuen Vorschrift der hiesigen unteren Oberbehörde verarbeitet worden sind. Es kann aber tatsächlich auch ein digitalisierungsprojekt sein: Da stehen acht Meter Leitz-Ordner, die man bei einem Umzug von einer anderen Organisation geerbt hat, aber ohne die Quelldaten und die sollen nun eingescannt und digital zugänglich gemacht werden. Für diese Aufgabe hätte ich dann übrigens jemanden an der Hand, der das schon mit ganz vielen Seiten gemacht hat. Das ist also durchaus vorstellbar.

Ich würde aber die Berechnung von irgendwas nicht an die Seitenzahl knüpfen, weil die ja ganz unterschiedlich voll geschrieben sein können, mal mehr, mal weniger Bilder haben usw. Da würde ich eine andere Berechnungsgrundlage anstreben.
Gutes Beispiel, warum man so was wissen möchte - aber du gibst gleich dazu die Gründe, warum die Seitenzahl so völlig uninteressant ist.
Höchstens wenn es um dien Abrechnung geht.
 
Hallo Freunde,
danke für eure Anregungen!
Zur Klärung, ich brauche diese Berechnung überwiegend für PDF-Dokumente, welche aus einem Nachlass stammen. Es sind mehrere Tausend. Sie enthalten überwiegend wissenschaftliche Texte. Dazu wäre es gut, wenn man die Anzahl der geschriebenen Seiten wissen würde.
Nun habe ich ein Script (danke Guzziholm für die Idee) mit Homebrew und dem Exiftool gemacht. Ratzfatz innerhalb von ein paar Sekunden hatte ich die Zahlen, die mir weitergeholfen haben.
Die Daten waren: 3435 PDF Dateien mit insgesamt 320000 Seiten (überwiegend A4 und A5). Die Worddokumente kommen mal extra dran.
Danke nochmals an alle!
ciao Chinese
 
@Schiffversenker: Vielen Dank für Deine hilfreichen Anmerkungen zur Problemlösung. Das hilft schon weiter, wenn man auch diese Aspekte beleuchtet. *plonk*

@Chinese: Gerne. Magst Du das Script vlt. teilen? Erlaubt das Forum das Posten von sowas? Wer weiß, wann man es mal gebrauchen kann. 3500 PDFs mit über dreihunderttausend Seiten? Das hoffentlich nicht einer alleine schreiben müssen. :)
 
Hallo zusammen,
300Tsd Seiten sind nicht gerade wenig. Als ich selbst noch Referent war, hatte ich auch innerhalb von 7 Jahren über 400000 Seiten geschrieben.
denke, da hat niemand was dagegen, wenn hier ein paar Infos ausgetauscht werden:
Die ganze Sache basiert auf HomeBrew. Das habe ich auf meinem Mac installiert.
Hier der Link https://brew.sh/index_de
Die Installation dauert etwas. Darnach kann man noch das Exiftool installieren. Geht über das Terminal:
brew install exiftool
Danach kann man noch die Scriptzeile mit der Rekursion aufrufen. Die Zeile ist jederzeit auf ein beliebiges Doc-Format anpassbar. Hier auf PDF bezogen.
Folgendes in das Terminal eingeben: exiftool -T -r -filename -PageCount -s3 -ext pdf . > Seitenanzahl.txt
Das Script ist nicht auf meinem Mist gewachsen. Hat mir ein Spezi gemacht.
ciao
Chinese
 
  • Gefällt mir
Reaktionen: KOJOTE, don_michele1 und GuzziHolm
Als ich selbst noch Referent war, hatte ich auch innerhalb von 7 Jahren über 400000 Seiten geschrieben.

Sowas geht? Ich meine – das sind jahrelang über 200 Seiten pro Arbeitstag. "Geschrieben"? Oder hattest Du einen Seismographen im Dauereinsatz?
 
@Leslie,
ja sowas ist möglich. Da ich damals (vor 10J) mehr als 220 Anschläge/Min machte und teilweise 6 Tage a 10 Stunden arbeitete ist das nichts Besonderes. Waren übrigens auch viele Zeichnungen und Schaltpläne dabei.
Die Techniker, die ich unterrichtete hatten ziemlich viel Stoff (Papier) mit sich zu schleppen.
ciao Chinese
 
Man könnte die Worddokumente auch in PDF Konvertieren und dann die Seitenzahlen mit deinem Script/Befehl auslesen - danach könnte man die PDF wieder löschen.

Oder man archiviert die Word Dokumente und arbeitet mit den PDF weiter - bei einem Nachlass wird ja kaum jemand mehr große Ergänzungen durchführen.
 
Zurück
Oben Unten