Automatisierung: HTML Datei in Ordner --> Umwandlung in PDF

E

eha

Neues Mitglied
Thread Starter
Dabei seit
02.09.2015
Beiträge
6
Reaktionspunkte
0
Hallo zusammen,

ich hänge derzeit bei folgender Problematik fest: Ich habe einen Ordner mit mehreren tausend .HTML bzw .htm Dateien. Gerne würde ich jede einzelne Datei in einem automisierten Prozess in eine eigene .pdf Datei umwandeln.

Im Idealfall funktioniert das Ganze so:
.html Datei oder .htm wird in einem Ordner abgespeichert. Damit startet der Prozess und die Datei wird in ein pdf umgewandelt. Wie letzteres geschieht ist mir eigentlich relativ egal: eine Idee wäre, die html Datei wird
1. mit Chrome geöffnet
2. der Druckdialog gestartet (CMD+P)
3. (der PDF-Printer ist bei mir Standardmäßig ausgewählt, daher: ) es wird automatisiert ENTER gedrückt (= d.h. pdf Datei wird im Ordner erstellt)
4. Browser-Fenster wird geschlossen
--> Prozess startet von vorne

Leider habe ich bislang keine Lösung gefunden, die dies umsetzt. Wohl geht das mit Automator oder mit einem AppleScript (es gibt wohl einen Convert Befehl), beides führte bei mir nicht - trotz stundenlangen Versuchen - zum Erfolg.

Daher hoffe ich, dass mir hier jemand weiterhelfen kann und freue mich schon auf Eure Rückmeldungen!

VG,
eha
 
Hallo,

ich kann folgendes empfehlen:
http://wkhtmltopdf.org

Installieren, dann im Terminal ausführen mit:
Code:
cd "/Pfad/zum/HTMLOrdner/" && for i in *.html; do wkhtmltopdf "$i" "$i.pdf";done

Das konvertiert alle html-Dateien im angegebenen Ordner in eine PDF Datei.
 
Funktioniert leider bei mir nicht.
Im Terminal kommt ein Fehler: "Error: Failed loading page http: (sometimes it will work just to ignore this error with -load-error-handling ignore)
Exit with code 1 due to network error: HostNotFoundError"
 
Ich schätze mal da stimmt was mit den HTML-Dateien nicht. Hast du es mal mit einer HTML aus einer anderen Quelle versucht? Kannst du eine Beispiel HTML mal hochladen?
 
Zuletzt bearbeitet:
Nein, an den HTML Dateien kann es nicht liegen. Mit anderen HTML2PDF Tools (die man händisch anstoßen muss) funktioniert es ja auch.

Mir wäre ohnehin lieber, wenn das Ganze automatisiert ablaufen würde, d.h. ich leg die HTML Datei in dem bestimmten Ordner ab, und es wird sofort die PDF Datei erzeugt.
 
Mit anderen HTML2PDF Tools (die man händisch anstoßen muss) funktioniert es ja auch.
Das schließt leider nicht aus, dass es an der PDF Datei liegt. Bei meinen PDF-Dateien funktioniert der Befehl.

Die Automatisierung ist später dann kein Problem, wenn wkhtmltopdf mal funktioniert. Einen Ansatz mit GUI-Scripting wie in deinem Eingangspost beschrieben ist zwar sicher möglich, halte ich aber für wenig sinnvoll bei mehreren Tausend Dateien.
 
Hinsichtlich des GUI-Scripting hast du sicher Recht.
Ich weiß bloß leider nicht, wo ich auf Fehlersuche gehen soll, da ja noch gar keine pdf Datei erzeugt wurde
 
Ich habe in der Eile oben PDF und HTML vertauscht, ich meinte mal eine andere HTML Datei zu versuchen, z.B. in Safari eine Website sichern, oder eine Beispiel HTML hochladen, dann teste ich das mal bei mir.
 
Hi,
danke schon mal für deine Hilfe!
Die HTML Dateien habe ich mittels iMacros erstellt. Allerdings funktioniert es auch nicht mit anderen HTML Dateien.
 
Mir ist aufgefallen, dass die obige Fehlermeldung auch dann kommt, wenn sich im angegebenen Ordner keine .html-Dateien befinden. Liegt da vielleicht der Fehler? Oder ist der Pfad nicht korrekt?

Hier nochmal eine Version des Skripts, das das vorher überprüft:
Code:
cd "/Pfad/";
for i in *.html;
do
    if [ "$i" = "*.html" ];
    then
        echo "No html file found!";
        break;
    else
        wkhtmltopdf "$i" "$i.pdf";
    fi;
done;
 
Eine Lösung via wkhtmltopdf ist - denke ich - eh nicht das Richtige für mich, da ich gelesen habe, dass die HTML Dateien als Image im pdf gespeichert werden, dadurch sehr groß und nicht durchsuchbar sind. Der Text muss durchsuchbar bleiben.

Ich bin auf das Folgende gestoßen: http://www.scottmadethis.net/interactive/url2pdf/
Allerdings habe ich keine Ahnung, wie ich das 1) installieren und 2) ausführen kann.

Ich würde es mit Hazel ausprobieren. Sprich: Wenn eine .html oder .htm datei in einen Ordner gelegt wird, soll das Apple Script url2pdf anspringen. Aber ich bekomme auch dies nicht zum Laufen... :(
 
Zurück
Oben Unten