Sammelthread DEVONthink

Kleiner Tip am Rande.
Nach einigen Try and Error Versuchen mit der Abbyy engine bekomme ich beim OCR die besten Ergebnisse mit der Auflösung 300 ppi bei Qualität 75%.
Scheint ein vernünftiger Kompromiss zwischen daraus resultierender Dateigröße und Qualität zu sein.
Ich habe 150 ppi bei 75% und finde den OCR-Vorgang arg lang. Ist er denn bei 300ppi kürzer?
 
Ich habe mehrere Datenbanken - mich nervt dabei eher, dass neu gescannte Dokumente teils im Eingang der "falschen" Datenbank erscheinen, woher sollen Scanner oder DT auch wissen, wofür das Dokument gedacht ist?

Es wäre schon toll, wenn DT neue Dokumente auch erst mal "anschaut" und abhängig von der Vorschlagliste entscheidet, welche Datenbank wohl wahrscheinlicher als Ziel ist. Mit dem globalen Eingangskorb werde ich auch irgendwie nicht warm. Dann müsste ich ja wirklich jedes Dokument in die passende Datenbank verschieben.

Gibt es da vielleicht noch Tipps/Tricks von Eurer Seite?
 
Komischerweise habe ich nur import & Delete. Von OCR steht nirgends was...
Da jedoch das HP Scanprogramm bereits durchsuchbare pdfs erstellt, geht es auch so.
Besten Dank an gandalf12
 
Komischerweise habe ich nur import & Delete. Von OCR steht nirgends was...
Da jedoch das HP Scanprogramm bereits durchsuchbare pdfs erstellt, geht es auch so.
Besten Dank an gandalf12

OCR geht nur in der teuersten Version, der Office Pro.

Dazu dann rechter Mausklick auf das Dokument in DT, und Umwandeln in durchsuchbares PDF.
 
ich nutze Devonthink pro Office V. 2.03.
Bei den Ordneraktionen sind nur
Devonthink - Import & delete
Devonthink - Import
Devonthink - Index
vorhanden.
 
habe es nun verstanden...
Habe einfach das obige script in meines eingefügt, nun geht es.
sehr cool, danke!
 
Gibt es eigentliche die Möglichkeit, die Datenbank per Kennwort zu verschlüsseln ?
 
Ja. Unter Datenbank-Eigenschaften. Aber das ist ein lächerlicher Witz: die DB ist zwar kennwortgeschützt, aber die eigentlichen Dateien, die im Datenbank-Ordnerpaket gespeichert sind, die sind weiterhin problemlos lesbar (Rechtsklick auf DB-Datei, Paketinhalt anzeigen und voilá). Keine Ahnung, was diese "Verschlüsselung" bringen soll ... . :confused:

Also, falls verschlüsselt, dann in einem verschlüsselten Discimage oder mit TrueCrypt nutzen, leider ... .
 
OK, danke. An ein Image habe ich nicht gedacht. Sollte aber funktionieren.

Werde dann wohl eher Lion abwarten. Da soll doch auch was in Sachen Verschlüsselung passieren.
 
Mein Problem ist eher, dass ich das gerne verschlüsselt hätte, um es zB auf Dropbox abzulegen ... dort ein verschlüsseltes Dateisystem aufzuziehen oder nur mit verschlüsselten Image-Dateien zu arbeiten ist sehr blöde, da dann die genialen Synchronisierungsmöglichkeiten über verschiedene Plattformen hinweg nicht mehr funktionieren.

Am Mac selbst sollte doch jetzt schon FileVault was bringen? (Ich nutze es selbst nicht, muss ich aber sagen.)
 
Hab von FileVault so viel schlechtes gelesen, dass ich es erst garnicht testen wollte :)
 
:) Aus dem Grund habe ich das auch gelassen -- dafür funktioniert TrueCrypt zumindest auf externen Medien m. E. einwandfrei.
 
Hast du die Datenbank auf einer Externen liegen ?
 
Hier ein interessanter Blogeintrag: Habe ich über Google gefunden.

Hat meinen Workflow ein wenig beeinflusst (z.B. Datumeingabe, Scannerwahl etc.).

Hilfreich für Einsteiger bei DV.

Klick mich
 
  • Gefällt mir
Reaktionen: Xhizors, Andy.321, Irgendwo und eine weitere Person
Möchte in Zukunft Pages Dokumente direkt mit DT öffnen. Habe dazu für verschiedene Zwecke entsprechende Vorlagen in Pages.

Wie bekomme ich meine eigenen Pages Vorlagen nun in die DT eigenen Vorlagen hinzugefügt ?
 
Workflow: Ordner erstellen. Z.B. PDF to OCR
Rechte Maustaste auf diesen Ordner. Ordneraktion erstellen wählen. Devonthink Skript OCR and Delete auswählen.
Im Scan Programm den Zielordner der gescannten Datein auf diesen Ordner legen.
Dokument scannen...erstelltes PDF wird im Ordner PDF to OCR gespeichert....Ordneraktion öffnet automatisch Devonthink welches automatisch einen OCR durchführt...Nach Abschluss wird das OCR´te Dokument im Eingang von Devonthink abgelegt...das Original Dokument im Ordner PDF to OCR gelöscht...
Es gibt auch noch andere Folder Scripte... Diese liegen im Ordenr.../Users/Library/Scripts/Folder Action Scripts
Aber hier nochmal:


-- DEVONthink - Import, OCR & Delete.applescript
-- Created by Christian Grunenberg on Fri Jun 18 2010.
-- Copyright (c) 2010. All rights reserved.

on adding folder items to this_folder after receiving added_items
try
if (count of added_items) is greater than 0 then
tell application id "com.devon-technologies.thinkpro2" to launch
repeat with theItem in added_items
try
set thePath to theItem as text
if thePath does not end with ".download:" then
tell application id "com.devon-technologies.thinkpro2"
set theRecord to ocr file thePath to incoming group
if exists theRecord then tell application "Finder" to delete theItem
end tell
end if
end try
end repeat
end if
end try
end adding folder items to


Im Unterforum für den Automator gibt es auch Scripte die aus einem Pages oder Word Dokument automatisch ein PDF erstellen. Daraus ein Droplet erstellen...
Workflow dort....
Dokument auf Droplet ziehen...Es wird automatisch ein PDF von diesem Dokument erstellt und im Ordner PDF to OCR abgespeichert...Devonthink startet...führt automatisch ein OCR durch...legt OCR´t Dokument im Eingang ab...löscht Original nicht OCR Dokument...Viola habe dann automatisch ohne eigenes zutun ein Original Pages oder Word Dokument und ein OCR´t PDF Dokument..

Vielen Dank für die Hilfe Gandalf, das klappt super! Ich habe da aber noch eine Frage, da ich mich mit programmieren überhaupt nicht auskenne:
Ist es möglich das Script so zu modifizieren, das es den Dateinamen der zu OCRrenden Datei ausliest und diesen dann auch in Devonthink verwendet? Momentan heissen alle meine Dokumente in DT "ohne Titel", obwohl ich sie nach dem scannen beim speichern benannt habe.
Falls da jemand helfen kann wäre ich dankbar. Sonst muss ich mir wohl eine andere Arbeitsweise angewöhnen.

Gruß
Civing
 
@Civing
Bei meinem oben beschriebenen Workflow ist mir ein solches Problem noch gar nicht aufgefallen.
Warum?
Ganz einfach wenn ich Dokumente scanne sitze ich vor dem Rechner und nach dem automatischen OCR wenn gefragt wird wo die Datei in der Datenbank abgespeichert werden soll gebe ich halt den Namen, Datum, Tag usw. ein. Ich habe mein ScanSnap Scannerprogramm aber so eingestellt, das nach dem scannen des Dokumentes kein Name vergeben werden muss. Er nimmt vom Scannprogrammm lediglich eine kryptische Bezeichnung aus Datum und Uhrzeit. Die richtige Benennung findet dann in Devonthink statt.
Aber:
Wenn ich keine frisch gescannte PDF Datei nehme, sondern eine schon vorhandene PDF Datei nehme z.B. eine Bedienungsanleitung aus dem Internet und ich diese aus dem Download Ordner auf meinen OCR Ordner (mit der Ordneraktion) per Drag and Drop ziehe wird Devonthink wie zu erwarten gestartet und das OCR beginnt nach Abschluss wird der Original Dateiname beibehalten und die Datei im DT Eingang abgespeichert.
Scanne mal deine Dokumente in einen separaten Ordner wie z.B. meine Scans. Ziehe dann nach Abschluss des Scanvorganges die dort abgespeicherte Datei mittels Drag and Drop auf deinen Ordner auf welchen die Ordneraktion für das OCR mit DT liegt.
Überprüfe mal deine DT Einstellungen. Dort gibt es eine Registerlache unter der man einstellen kann wie neu importierte Dokumente behandelt werden sollen. Originalname mit Dateiendung oder ohne usw.
Musst halt ein bisschen experimentieren.
Bei mir funktioniert alles wunderbar.
Wenn du gar nicht weiterkommst kannst du dich ja mit obigen Script noch an das Automator und Scripting Unterforum wenden. Die können dir dort bestimmt beim "ummodeln" des Scriptes helfen......
 
Hallo Gandalf12,

Danke für die Antwort. Wenn ich "fertige" Dokumente über den OCR-Ordner in DT ziehe werden die Namen auch übernommen. Ich werde die Dateien zukünftig auch in DT benennen, dann geht das Scannen auch schneller.

Danke für Deine Hilfe! :)
 
Zurück
Oben Unten