word nach html exportieren

max@hismac

max@hismac

Aktives Mitglied
Thread Starter
Dabei seit
05.03.2004
Beiträge
1.797
Reaktionspunkte
158
moin,

ich habe einen word text mit vielen hoch- und tiefgestellten stellen, den ich gern in ein html exportieren würde, wobei diese darstellung erhalten bleiben soll, sprich <sup></sup> und <sub></sub>. der einzige nachteil ist, dass word neben einfachen inhalten auch noch drei tonnen unbrauchbares exportiert.

wenn ich den text einfach kopiere und woanders einfüge, zum beispiel in einen texteditor, sind die hochgestellten teile meist einfach in normalen text geändert, was auch nicht hilft.

nun habe ich gesehen, dass es programme gibt, die den word html code optimieren, was auch nicht zufrieden stellend war.

folglich schlage ich hier auf und suche rat. HNO3 soll HNO[SUB]3[/SUB] bleiben.
 
Ich fürchte, Du hast schon alle in Frage kommenden Optionen erwähnt außer "manuell optimieren".
Dass Word einen furchtbaren Code zusammengeneriert, ist leider "normal" wie nicht abstellbar.
 
Du könntest noch versuchen, ob die anderen Office-Suiten etwas Besseres fabrizieren.
 
Eine Variante wäre noch, den Inhalt in einen WYSIWYG-HTML-Editor zu kopieren und dort weiter zu bearbeiten und zu speichern. Ohne Handarbeit wird es da auch nicht gehen, allerdings liefern die in der Regel besseren HTML-Code. Auf der Arbeit benutze ich – für recht einfachen bzw. nicht sehr komplexen Code – ab und an mal Dreamweaver. Keine Ahnung, welche kostenlosen Editoren es für Mac gibt.
 
Der Nachteil ist, dass H[SUB]2[/SUB]O in meinen Editoren zu H2O wird und ich die 2 per Hand markieren und tiefer stellen muss. Da es um etwa 80 Seiten Text geht, wäre eine automatische Methode wünschenswert.
 
Notfalls geht ja immer noch Suchen und Ersetzen im HTML Code.
 
nein, eben nicht, weil die 2 in H2O nicht mehr als tiefgestellt erkennbar ist und somit alle 2en erkannt würden. Es müsste eine Methode geben, mit Suchen und Ersetzen ein nicht druckbares Zeichen für "hier beginnt tiefgestellt" und "hier endet tiefgestellt" zu erkennen und zu ersetzen.
 
Ganz schmutzig: Du kannst in Word nach Format "Tiefergestellt" suchen. Dieses dann ersetzen durch [noparse]<sub>Zahl</sub>[/noparse].
Ist zwar auch etwas Arbeit, hält den Aufwand evtl. etwas überschaubarer.
 
nein, eben nicht, weil die 2 in H2O nicht mehr als tiefgestellt erkennbar ist und somit alle 2en erkannt würden. Es müsste eine Methode geben, mit Suchen und Ersetzen ein nicht druckbares Zeichen für "hier beginnt tiefgestellt" und "hier endet tiefgestellt" zu erkennen und zu ersetzen.

Die Methode ist, in HTML nach H2O zu suchen und dieses durch H2O tiefgestellt zu ersetzen. Nur nach einer 2 zu suchen, hilft natürlich nicht.
 
Ich fürchte, Du hast schon alle in Frage kommenden Optionen erwähnt außer "manuell optimieren" …
:crack: Naja, wenn das Ziel HTML ist, heißt die Antwort doch schlicht: gar nicht erst mit Word arbeiten.

Den unformatierten Rohtext in einen Texteditor (oder wenn’s sein muss, einen WYSIWYG-Editor) rein, dann dort mit den nötigen Marken versehen, in der zutreffenden Kodierung (meist heute UTF-8) speichern, und gut is’.

Das Nacharbeiten von durch Word erzeugtem Quellcode ist doch eine Σίσυφος-Arbeit.
 
Zuletzt bearbeitet:
Ganz schmutzig: Du kannst in Word nach Format "Tiefergestellt" suchen. Dieses dann ersetzen durch [noparse]<sub>Zahl</sub>[/noparse].
Ist zwar auch etwas Arbeit, hält den Aufwand evtl. etwas überschaubarer.

wie mach ich das?
 
Die Methode ist, in HTML nach H2O zu suchen und dieses durch H2O tiefgestellt zu ersetzen. Nur nach einer 2 zu suchen, hilft natürlich nicht.
ich habe etwa 80 Seiten Text, in denen alle mögliche vorkommen kann, H2O, H3PO4, Ca2+, wobei ich nicht alle möglichkeiten kenne, ohne den Text im einzelnen durchzugehen. ich suche also eine möglichkeit, den Text automatisch zu ändern.
 
wie mach ich das?
Erweitertes Suchen und Ersetzen:

WD2011-ErwSuchErsetz.jpg
 
Auf alle Fälle solltest Du nicht post #3 folgen und zb Libre Office benutzen.
 
Erweitertes Suchen und Ersetzen:

das hatte ich, aber dafür muss ich auch alle beispiele einzeln durchgehen, also erst alle tiefgestellten zweien, dann alle dreien, dann aufpassen, dass bei 2+ nicht die 2 schon bei den zweien erfasst wurde und so weiter oder? oder kann ich da wildcards einbauen und einfach sagen, alles was tiefgestellt ist generell zwischen <sub></sub> einsetzen und fertig?
 
Oder nach Plaintext kopieren und dann mittels regulärer Ausdrücke nachformatieren
 
Zurück
Oben Unten