PDF OCR X: Keine .bak-Dateien erstellen?

mds

Aktives Mitglied
Thread Starter
Dabei seit
19.07.2009
Beiträge
1.423
Reaktionspunkte
74
Weiss jemand von Euch, wie man PDF OCR X so konfigurieren kann, dass bestehende PDF-Dateien bei der Texterkennung überschrieben sowie keine .bak-Dateien erstellt werden?

In den Einstellungen habe ich dazu leider nichts gefunden und das nachträgliche, manuelle Löschen der .bak-Dateien ist mühsam.

Zur Erklärung:

1. test.pdf mit PDF OCR X im No-prompt-Mode öffnen, die Texterkennung wird durchgeführt.
2. Danach liegen test.pdf und test.bak im Verzeichnis.
 
hast du in den settings denn nicht "overwrite pdfs"?
 
und dann werden trotzdem .bak erzeugt?
 
kannst du mal in ~/Library/Preferences nach files beginnend mit ca.weblite.* schauen?

ls -al ~/Library/Preferences/ca.weblite.*
 
Ja, drei Dateien waren vorhanden.
 
Automator Aktion !
Kommt darauf an, wie kompliziert es wird.
Ich erinnere mich nämlich, zumindest früher gab es etliche Programme, die Sicherungen mit dem Suffix .bak erzeugten. Wird noch so ein Programm benutzt, sollte man nicht automatisch alle .bak löschen.
Der beste Ablauf hinge dann davon ab, ob alle bak-Dateien im gleichen Ordner landen oder ob man das Erstellungsdatum als Auswahlkriterium benutzen müsste, wieder unter dem Vorbehalt, daß das andere Programm in der Zwischenzeit nicht aktiv wird.
Einen Creator-Code wie unter Prä-X-Systemen gibt es ja nicht mehr.

Sind das denn soviel und so große Dateien, daß sie schnell gelöscht werden müssen?
Sonst würde ich einfach einmal die Woche oder so per Fidnersuche alle bak anzeigen lassen im Dokumenteordner oder wo sonst sie liegen (die Findersuche funktioniert rekursiv) und auf einen Schlag löschen.

Daß das Programm automatisch Backups anlegt, hat sicher einen Sinn.

Wenn sie generell überflüssig sind und alle im gleichen Ordner landen (oder in einer beschränkten Anzahl, aber immer in den gleichen) könnte man auch eine Ordneraktion erstellen, damit sie beim reinschreiben sofort gelöscht werden.

Wobei der von Olivetti angepeilte Weg natürlich der bequemste, effizienteste und komfortabelste ist…
Aber viel Wege führen bekanntlich nach Cupertino.
 
@mds
waren? :d

ich wollte sie sehen, bzw. ist da eine*.ocr.plist?
 
Ja, waren, ich habe sie just for fun gelöscht … was aber 1) keine Änderung bewirkt hat und 2) läuft die Software mit unveränderter Konfiguration weiter …
 
warum löschst du die? das sind deine konfigurationsdateien.
ich wollte wissen, was in einer datei drinsteht und evtl. einen eintrag vornehmen.
so wird das nix.
 
Keine Sorge, die Dateien lassen sich wiederherstellen … ich wollte sehen, ob die App auf diese Konfigurationsdateien überhaupt reagiert – anscheinend nicht.

Nachfolgend die Konfiguration:
Code:
// !!! BINARY PROPERTY LIST WARNING !!!
//
// The pretty-printed property list below has been created
// from a binary version on disk and should not be saved as
// the ASCII format is a subset of the binary representation!
//
{    "/ca/weblite/pdfocrx/" = {
        "app/" = {
            "APP_SETTINGS/" = {
                autoOpen = "true";
                promptMode = "NO_PROMPT";
            };
            "OCR_SETTINGS/" = {
                autoDetectOrientation = "true";
                hardWrap = "true";
                inputQuality = "High";
                language = "deu";
                outputMode = "SEARCHABLE_PDF";
                overwriteOriginal = "true";
                overwriteTarget = "false";
                repairOutput = "true";
                searchablePDFSuffix = ".pdf";
                textSuffix = ".txt";
            };
        };
    };
}
 
setze overwriteTarget auf true und teste.
 
Hilft leider nicht. Die Einstellung wäre ja eigentlich dafür gedacht, dass die ursprüngliche Datei nicht überschrieben wird, aber die neue zu schreibende Datei aus irgendeinem Grund bereits vorhanden ist.
 
da overwriteOriginal schon true ist, würde ich einen bug melden.
 
Bug Report ist unterwegs, Neuigkeiten folgen … :)
 
Bislang hat der Entwickler leider nicht geantwortet. Kein gutes Zeichen!
 
Zurück
Oben Unten