Synology Drive: PDF-Dokumente durchsuchen
Ich habe in den letzten Jahren immer mal wieder über mein papierloses Büro berichtet. Ist bei mir recht einfach, Rechnungen versende ich online und oft bekomme ich die auch online. Was ich nicht zwingend benötige, landet in der Tonne, im echten Leben sowie auch digital. Ich bekam oft die Frage, wie ich es mit Datenbanken halte, wie ich also Dokumente verwalte. Die Antwort war immer die gleiche: Gar nicht. Ich brauche keine Datenbanken, um irgendwelche Dokumente wiederzufinden. Dafür ist mein Aufkommen an Dokumenten zu klein.
Ich bin so der klassische Ordner-Typ und wuppe da immer die entsprechenden Dokumente rein. Angebote, Rechnungen, Quittungen, Paketmarken und so. Ich komme damit gut klar. Dann aber folgt immer die Frage nach der Indexierung der Inhalte.
Viele denken ja, dass sie ein Dokument abfotografieren können und es dann immer wiederfinden. Nun, das ist bekanntlich nicht so. OCR ist das Stichwort und da führen viele Wege nach Rom. Viele Scanner oder All-in-Ones können scannen und liefern gleich Texterkennung (OCR) mit.
Alternativ kann man es wie ich machen, sich mobile Apps wie ScanBot oder Scanner Pro von Readdle anschauen. Das sind so meine Favoriten. Dokument abfotografieren, OCR rüberlaufen lassen und auf Wunsch automatisiert irgendwo speichern. Nun zu diesem „irgendwo“ speichern. Wenn ich es irgendwie auf meinem Mac habe, dann indexiert dieser auch Texte.
Über die Spotlight-Suche finde ich also auch Dokumente, wenn ich ein enthaltenes Wort eintippe. Und Windows 10 indexiert bei PDF-Dateien standardmäßig Eigenschaften und Dateinhalte und findet so Texte.
Reicht sicher vielen. Aber ich möchte hier noch einmal kurz auf die Möglichkeiten eingehen, die ein Synology-NAS bietet. Inwiefern andere Hersteller das auch anbieten – keine Ahnung. Synology indexiert auch Texte, also auch eure ocr’ten PDF-Dokumente. Nutzt ihr da die Suche – beispielsweise im neuen Drive – dann findet dieser auch Inhalte von PDF-Dateien.
Ihr müsst also nicht zwingend eine fremde Cloud nutzen, geschweige denn etwas auf dem eigenen Rechner ablegen. Und wenn ihr euch daheim mit Frau oder Kindern einen gemeinsamen Büro-Ordner mit entsprechenden Freigaben teilt, dann könnt ihr dort auch alles einmal lagern, aber für alle durchsuchbar. Und praktischerweise kann man sich dann auch gleich eine Verknüpfung zum Synology Drive in die Lesezeichen hauen, um direkt darauf zuzugreifen.
Ist vielleicht nicht grundsätzlich neu (das war auch mit Synology Office machbar) – abgesehen von Synology Drive – aber vielleicht hilft es ja jemandem, seine Papiere auch lose besser zu finden. Und am Rande noch ein kleiner Tipp, falls ihr Dokumente im Nachhinein mit OCR versehen wollt: Es gibt viele Lösungen, ich persönlich habe da PDF OCR X im Einsatz, kostenlos für Windows und macOS.
Auch zum Thema:
Adobe Scan: Kostenlose Scan-App mit OCR
Ich habe das Programm PDF OCR X mal installiert und auf einem MAC getestet.
Dabei musste ich feststellen, dass die Orientierung der erzeugten PDF falsch war und wenn ich dann das PDF im MAC Viewer gedreht habe, das File nicht mehr richtig indizierbar war.
Leider auf den ersten Blick für mich total unbrauchbar oder ich mache etwas total falsch.
Ich habe wirklich viel OCR-Scanapps ausprobiert und bin letztendlich bei Google-Drive gelandet. Auch hier wird die PDF mittels OCR indiziert und das funktioniert echt sehr zuverlässig.
Nur so als Tipp 🙂
Leider bleibt die Indizierung innerhalb von Google Drive.
Die exportierten PDFs habe keine texte mehr und lassen sich damit nicht mit anderen Tools nutzen.
Microsoft Lens ist da besser.