Ein weitere Versuch, auf ein papierloses Büro umzusteigen! Bisher bin ich meistens vor der Angst des totalen PDF Datenverlustes schon gescheitert. Aber da ich ja schon fest von meinem NAS träume, rückt das Thema wieder in den Fokus. Und ich will ja bereit sein, wenn das NAS fertig ist 🙂

Was wird benötigt:

  • Scanner, klar. Am Besten mit automatischem Dokument-Einzug.
  • OCR Software – Bild in Text umwandeln
  • Dokumentenverwaltung – Schlagworte, Ordner, Suchen usw.

Da ich seit einiger Zeit wieder stolzer iMac 27″ Besitzer bin, bezieht sich hier alles auf OSX. Unter Windows ist’s echt einfacher, da gibt’s Paperport oder ähnliche Software, die da alles in einem Durchlauf macht.

1. Scanner

Als Scanner habe ich mir einen HP Office Jet Pro 8500A Plus gekauft. Dieser hat zwei geniale Features. Einmal kann er direkt Scan-to-Mail ohne PC! und zweitens kann er Scan-to-Folder ohne PC auf ein Netzlaufwerk. Natürlich hat er noch ein spaciges Design und ein iPhone-Like Touchpanel. Der Drucker ist über eine einmalige E-Mail Adresse auch übers Internet erreichbar, kann per AirPrint von iOS Device bedient werden, hat USB, WLAN und Ethernet. Doppelseitig drucken und scannen runden das gesamt Paket ab. Dazu gibt es kompatible Pech Patronen. 🙂 Was will man(n) mehr?

Der Scanner scannt also meine Rechnungen und legt diese als PDF ohne mein Zutun auf einem Share ab. Soweit so klar? Einfach. Steht auch im Manual wie man das macht…

2. OCR Software

Lange gesucht, lange überlegt…da ich aber ebenso stolzer Besitzer einer legalen Adobe Creative Suite 5.5 Design Standard für OSX bin, besitze ich Adobe Acrobat X Pro. Bin ich natürlich nicht selbst drauf gekommen, aber ja, Acrobat kann PDF in durchsuchbare PDF umwandeln (OCR). Inklusive drehen, Gerade rücken usw. Dafür gibt es Aktionen die auf geöffnete Dateien oder Ziel Ordner angewendet werden können.

Gut, logische Schlussfolgerung, es muss Automator-Aktionen für Acrobat geben, um diese Aktionen auszulösen. Ganz klar. Ist ja einfach oder? Nein, leider hab ich keine Automator-Aktionen gefunden. Dafür aber ein Apple-Script von Joe Kissen. Es wurde in einem Artikel bei macworld hier erwähnt. Der Download zum Script ist hier. Das ZIP enthält Apple Scripts für diverse OCR Programme. Mich hat eigentlich nur das Script „OCR This (Acrobat).scpt interessiert. Einfach erklärt, startet es Adobe Acrobat, schaut ob eine definierte Aktion vorhanden ist, wenn nicht, wird diese erstellt (Eine OCR Aktion). Beim nächsten mal wenn das Script aufgerufen wird, wird automatisch die Aktion gestartet. Leider hatte es noch einige Unzulänglichkeiten, daher habe ich das Script für die Deutsche Version angepasst, inkl. Schliessen der Dateien nach erfolgreichem erkennen und umwandeln. Joe Kissen hat mir erlaubt das angepasste Script hier zur Verfügung zu stellen. OCR This (Acrobat) nur für Acrobat X Deutsch.

Zuerst das Script im Library – Scripts – Folder Action Scripts Ordner ablegen. Jetzt muss das Script noch als eine „Folder-Action“ einem OSX Finder Folder hinzugefügt werden. Dazu im Kontextmenü des Ordners (oder eben Share) Ordneraktionen konfigurieren wählen und hier das Script auswählen. Sobald OSX im Ordner eine veränderte Datei findet, wird das Script ausgeführt, sprich Adobe Acrobat gestartet und für jedes PDF eine OCR Erkennung gemacht. Für meine Zwecke reicht das völlig. Eventuell stosse ich ja noch auf andere Tools, aber vorerst versuche ich es so.

3. Dokumentenverwaltung

Hier habe ich iDocument von IcyBlaze ausprobiert. Die Software macht was sie soll. Einzig Smart Folders und Smart Rules basierend auf einer Text-Suche scheinen hier nicht zu funktionieren. Noch nicht. Ich erwarte noch Antwort des Supports. Update:

 



Soweit hier mal mein Setup. Hier gibt’s noch einiges zu optimieren, ich werde den Beitrag so weit es geht, aktuell halten.