Warum sind Pages-Dokumente deutlich größer als MS-Word-Dokumente?

S

sculptor

Aktives Mitglied
Thread Starter
Dabei seit
30.12.2016
Beiträge
1.353
Reaktionspunkte
491
Hallo zusammen,

ich habe gerade ein paar Word-Dateien mit Pages geöffnet, da ich kein Word mehr auf meinem iMac habe. Dabei ist mir aufgefallen, dass das Dokument im Pages-Format deutlich größer ist als im Word-Format (docx). Das Pages-Dokument hat eine Größe von 653 KB und das Word-Dokument nur von 43 KB. Beide Dateien haben den selben Inhalt. Bilder wurden keine verwendet. Mir ist klar das beide Dateien für die heutige Zeit natürlich nicht sonderlich groß sind, trotzdem ist der Größenunterschied zwischen beiden mit einem Faktor von 15 ja schon erstaunlich. Hat jemand eine Idee woran das liegt?

Grüße
sculptor
 
Da wäre interessant zu wissen, ob das Pages-Format immer 15x größer ist als docx - oder ob es vielleicht immer 600 kB größer ist, unabhängig von der Größe.
 
  • Gefällt mir
Reaktionen: Macuser4880
Da wäre interessant zu wissen, ob das Pages-Format immer 15x größer ist als docx - oder ob es vielleicht immer 600 kB größer ist, unabhängig von der Größe.
Das erste kann ich mir nicht verstellen. Das würde bedeuten, dass eine 10 MB Word-Datei ca. 150MB groß im Pagesformat wäre;)

Wenn ich mich recht entsinne, eine Word-Datei "wächst" schneller, also irgendwann wenn es da drin viele Bilder sind usw. wird die Word-Datei größer als die entsprechende Pages-Datei mit demselben Inhalt.
 
Da wird wohl unterschiedlicher Overhead im Hintergrund mitgeschleppt. Ich habe gerade mal ein Pages und ein RTF-Dokument aus pages mit dem String "Test" erstellen lassen. Das Pages-Dokument hat 76 kb, das RTF 0,5 kb. Wenn ich das Dokument aus pages als Docx exportiere hat das 7 kb. Wenn Du mehr wissen willst, kannst Du aus Deinen Dateien mal RTF erstellen und die mit einem reinen Texteditor/Codeeditor anschauen. Ansonsten sind Word und Pages "Blackboxes", wo man nicht weiß, was da alles drin steckt.

Liebe Grüße
Tommi
 
Da wird wohl unterschiedlicher Overhead im Hintergrund mitgeschleppt.

Und das nicht zu knapp. Auch Word bläht sich auf MB-Größe auf, wenn statt Absatz-und-zeilen-bezogenem Text mit frei definierten Textrahmen gearbeitet wird. Folgt dann noch ein Rücksichern vom speicherplatzkomprimierenden .docx auf das alte .doc, ist es vorbei mit Kilobyte-Größe.
 
Und das nicht zu knapp.
Speichert das .pages-Format nicht auch eine PDF-Vorschau auf das Dokument mit in seinem Dateikörper?
Sorgt nicht auch die Art und Weise, wie aktuelle MacOSXe Dateiänderungen in der Dokumentdatei mitspeichern, für ein Aufblähen dieser Dateien?
 
Speichert nicht auch M$ Word Änderungen in der docx-Datei? Da war mal was zu lesen - ich benutze weder Pages noch Word - daß man beim weitergeben von Word-Dateien durchaus auch (manchmal peinliche) alte Versionen oder Kommentare mitverschickt, die man an sich glaubt, gelöscht zu haben, nur ein Exportieren als neue Datei soll helfen.
Das würde natürlich enorme Dateigrößen erklären.

Ob aktuelle Mac-Systeme Änderungen tatsächlich in den Dateien speichern oder als eigene Versionsdateien, kann ich nicht beurteilen. In den aktuellsten Fällen habe ich das allerdings eher so verstanden, daß Änderungen eher als "Häppchen" gesichert werden und nicht mehr komplett die ganze geänderte Datei. Da würde mich wundern, wenn die Dateien aufgebläht würden.
 
Speichert nicht auch M$ Word Änderungen in der docx-Datei?
Jein.
Bei gewöhnlicher Bearbeitung werden Rückgängig-Schritte nachverfolgt. Die sind aber beim Schließen des Dokuments weg.
Ebenso werden Dokumentinfos (vom Ersteller bzw. Programmbenutzer selber eingegeben – bzw. sowas wie Wörter-/Zeichenzahl) als Metadaten gespeichert.
Bei aktivierter Überarbeiten-Funktion werden selbstverständlich Änderungen (d.h. eher Änderungsvorschläge) und Kommentare der Bearbeiter protokolliert. Die Reduzieren sich aber beim Entfernen von Kommentaren und Annehmen/Ablehnen von Änderungen.
Fürs Entfernen persönlicher Daten beim Speichern gibt’s eine separate Einstellung im Programm.
In älteren MSO-Versionen war’s noch hilfreich, die Dokumentdatei unter neuem Namen zu speichern.
 
  • Gefällt mir
Reaktionen: Schiffversenker
Zumindest das neuere Word-Format .docx ist lediglich eine Ansammlung von XML-Dateien, das kann man sich sehr wohl anschauen - siehe:

Was Word oder Pages macht, wenn es fremde Dateiformate in das „eigene“ Dateiformat konvertiert ist schon eine Blackbox. Das kann je nach Ausgangsdatei halbwegs vernünftig klappen, aber auch nur eine Menge unbenutzbaren Dateimüll erzeugen.
Ich kann mich noch daran erinnern als Adobe in Acrobat Pro ihren Pdf-zu-Word-Konverter integriert hat. Da hab ich mir mal spaßeshalber mit LaTeX ein mehrere hundert Seiten lange pdf-Datei mit Fließtext erzeugt (ein paar MB groß) und den Konverter drauf angesetzt. Heraus kam mehrere hundert MB Datenmüll. Ich war aber auch fieß, denn ich hatte mir im Dokument markieren lassen wieviel glue (um wie viel jede Zeile gestreckt bzw. gestaucht wurde, um den Blocksatz hinzubekommen) in jeder Zeile verwendet wurde. Und damit konnte der Konverter nicht umgehen.

PS: Ich nehme zum Konvertieren von Dokumenten übrigens gerne pandoc. Das unterstützt allerdings meines Wissens nach nicht das Format von Pages. Aber das benutzt ohnehin kaum jemand, der nicht nur in seiner eigenen kleinen Blase (schließlich wird das Pages-Format nur von einem kaum verbreiteten Textverarbeitungsprogramm, das zudem nur unter macOS läuft, verwendet) leben will.
 
Wieso pages und numbers so etwas machen, interessiert mich persönlich weniger. Aber das hindert mich daran, diese Programme weiter zu benutzen. Meine Kontoumsätze bspw. – also eine Kalkulationsdatei mit 12 Blättern – ist als .xlsx-Datei 59 KB groß, als .ods 63 KB und numbers braucht dafür ganze 1,1 MB!

Leider summiert sich das mit der Zeit, sodass – trotz des angenehmen look&feel und guten Features wie dem Scanimport vom iPhone – weiterhin Libre-Office mein Favorit bleibt. Denn es geht nicht nur um den Platz auf der Platte, sondern auch um den raren Platz in der Cloud für das Backup.
 
Wieso pages und numbers so etwas machen, interessiert mich persönlich weniger. Aber das hindert mich daran, diese Programme weiter zu benutzen. Meine Kontoumsätze bspw. – also eine Kalkulationsdatei mit 12 Blättern – ist als .xlsx-Datei 59 KB groß, als .ods 63 KB und numbers braucht dafür ganze 1,1 MB!

Tja, die Dateiformate sind auch nicht zum Speichern und Austausch von Rohdaten gedacht. Alleine schon, weil darin Formeln enthalten sein können, die am Ende nur von dem Programm vernünftig gelesen und verarbeitet werden können, mit dem die Daten erstellt wurden.
Ein simples Dateiformat wie CSV oder eine einfache XML-Datei ist da wesentlich effizienter (was die Dateigröße angeht) und auch kompatibler.
Im vorliegenden Fall scheint numbers in der Datei ziemlich viel (unnötigen) Overhead mitzuspeichern. Keine Ahnung ob Numbers da irgendeine versteckte Option mitbringt, mit der man das abstellen kann, ich vermute aber eher nicht.
 
Zurück
Oben Unten