xPDF&pdftk oder ähnliche Tools unter Leo?

tschloss

tschloss

Aktives Mitglied
Thread Starter
Dabei seit
14.04.2007
Beiträge
1.234
Reaktionspunkte
51
Hi,
für ein Bash-Skript benötige ich zwei Funktionalitäten, die ich bisher unter Linux mit den im Titel genannten Tools bekam. Ich möchte das nun vorzugsweise ohne Darwinports, Fink & Co. unter OS X zum Laufen bringen.

Funktionalitäten
1. pdftotext (bisher aus xPDF): extrahiert den Text aus einem PDF in einigermaßen lesbarer Form (plain). Anm: eigentlich suche ich nur einen bestimmten Text-String (Muster= "e-Mail: ...@....")

2. (bisher mit pdftk)
a) Alle Seiten eines PDF mit Briefkopf versehen ("background")
b) Ein PDF in Einzelseiten-PDFs zerschlagen ("burst")

Any hints? VIelen Dank im voraus?

VG Thomas

PS: Hintergrund: ich habe aus einer Mitgliederverwaltung ohne Serienmailer einen Druckjob mit 500 Mitgliedsrechnungen in einer PDF-Datei. Die muss ich zerlegen und eine Liste aufbauen, welche Einzeldatei an welche e-Mail-Adresse gesendet werden soll - schließlich will ja jeder seine eigene Rechnung erhalten ;)
 
Ich sehe grade ohne Darwinports und dergleichen ... wer lesen kann ist im Vorteil.

Was spricht denn gegen Fink oder Macports?

Was anderes kenne ich aber nicht. Wobei du die Abhänigkeiten auch alleine installieren kannst.

Sowohl xpdf als auch pdftk sollten sich über macports (http://www.macports.org/index.php) installieren lassen. Bei den Scripts müsstest du warscheinlich nur noch die Pfade anpassen.
 
1. pdftotext (bisher aus xPDF): extrahiert den Text aus einem PDF in einigermaßen lesbarer Form (plain). Anm: eigentlich suche ich nur einen bestimmten Text-String (Muster= "e-Mail: ...@....")

2. (bisher mit pdftk)
a) Alle Seiten eines PDF mit Briefkopf versehen ("background")
b) Ein PDF in Einzelseiten-PDFs zerschlagen ("burst")

Unter Leopard kann das alles "Automator", die Funktionen wären:
2a) "PDF mit Wasserzeichen"
2b) "Bilder aus PDF"
1) "PDF Text extrahieren"

Wobei wohl noch Applescript nötig wäre, um z.B. den String zu lesen.
 
Zurück
Oben Unten