Docutain: Scannen, OCR und PDF-Erstellung auf Android und iOS
Wir haben letztens den Hinweis eines Lesers bekommen, der zufrieden eine App einsetzt, die aber noch nicht bei uns im Blog vertreten ist. Also habe ich mir Docutain einmal angeschaut. Auf den ersten Blick eine Scanner-App, quasi nichts Besonderes. Scanner-Apps werden von vielen Anwendern mit geringen Ansprüchen oft verwechselt. Viele der kostenlosen Lösungen machen nämlich nur eines: Abfotografieren eines Dokumentes. Ein Text wird dabei nicht extrahiert. Muss auch nicht zwingend, sollte man aber machen, wenn man das Dokument oder seinen Inhalt finden will. Möglichkeiten zur OCR-Nachbearbeitung gibt es viele und einige auch in unserem Blog.
Docutain versteht sich nicht nur als Scanner-App, man kann damit auch gescannte Dokumente verwalten. Neben der mobilen Anwendung für Android und iOS gibt es auch einen kostenpflichtigen Windows-Client. Erwähnenswert ist, dass Docutain On-Device-OCR anbietet, also nicht wie das kostenlose Adobe Scan die Dokumente in die Cloud befördert, um sie auf fremden Servern umzuwandeln. Grundsätzlich ist Docutain kostenlos nutzbar, 4,99 Euro bringen aber die Möglichkeiten abseits von OCR zum Einsatz.
Da gibt es dann die Möglichkeit, die PDF-Dateien auch über einen Dateimanager zu teilen, PDFs zu importieren oder Erinnerungen zu erstellen. Vielleicht reicht einigen von euch aber auch die kostenlose Variante. Zwar optisch nicht ganz so fancy wie Scanbot, die ja verkauft wurden, aber doch solide und brauchbar. Und klar: Dokumente lassen sich auch extern sichern (iCloud, GoogleDrive, OneDrive, Dropbox, STRATO HiDrive, MagentaCLOUD, Web.de, GMX MediaCenter, Box)
https://apps.apple.com/de/app/id1416707024
https://play.google.com/store/apps/details?id=com.infosoft.docutain
Danke für den Tipp. Klingt interessant und zum Glück keine Abo-Gebühr. Ist Ja leider auch nicht mehr selbstverständlich.
@cashy nutzt du für den papierloses Büro eigentlich eine Dokumentenverwaltungssoftware?
Euer Artikel ist vom 20.6, in den GooglePlay-Kommentaren werden aber an vorherigen Tagen (17.6) Unzulänglichkeiten in den Cloudfunktionen angeprangert. Wenn ihr scheinbar neutral über Produkte berichten wollt, dann solltet ihr zumindest auf aktuelle Kommentare eingehen bzw. idealerweise eure eigenen Test/Erfahrungen zu Fehler mitteilen.
Hallo Frankie. Den Beitrag habe ich bereits am 10.6 geschrieben. Verrät in diesem Fall auch der Dateiname des Bildes.
Kann ich für ein privates Blog nachvollziehen, beim Profi-Blog muss man sich man sich natürlich die Titelzeile „von caschy Jun 20, 2020 | 16 Kommentare“ vorhalten lassen 😉
Und wenn es in 1 Woche andere Unzulänglichkeiten gibt, muss Caschy seinen Artikel „updaten“?
Unfassbar, was manche Menschen für Ansprüche haben.
Wieso Update? Ein Artikel sollte nur aktuell zum Zeitpunkt der Veröffentlichung sein, dies ist ein normaler Anspruch. Aber in den Bilddaten ein Datum suchen zu müssen, damit man erkennt, dass das Artikeldatum falsch ist, ist dagegen durchaus ein überzogener Anspruch.
Sätze die „was andere Leute für Ansprüche haben“ gehören dagegen nicht in das Umfeld eines „gepflegten“ Blogs. Jeder darf seinen eigenen Anspruch haben, aber keiner sollte den anderen dafür abwerten…
@FrankieTNG: Ich sag mal so: Wir beide werden keine Freunde mehr. Wenn ich Apps vorstelle, dann blogge ich oftmals etwas vor. So wie hier. Der Beitrag sollte bereits letzte Woche online gehen und wurde durch nen Kollegen verschoben. Ich hab schon 1000 Sachen gebloggt und kann leider nicht immer alles auf dem Schirm haben. Schafft keiner. Wenn ich deinen Anspruch dann offensichtlich nicht erfüllen kann, dann bist du hier falsch. Und ich bin immer ehrlich: Leser wie dich, die mir solche dummen Sprüche drücken („scheinbar neutral“), möchte ich auch nicht „bedienen“.
@caschy: Ich lese deinen Blog schon seit Jahren immer gerne. Er ist zwar recht oberflächlich, allerdings wird man über Neuigkeiten informiert. Für fundierte Infos besuche ich andere Webseiten bzw. bilde mir eine Meinung auf anderer Basis.
Allerdings gefällt mir jetzt gerade etwas überhaupt nicht und deswegen nehme ich mir die Zeit und schreibe diesen Kommentar. Ich denke, dass es im Interesse aller ist, wenn du das Feedback in den Kommentaren einfach annimmst, anstatt Leuten, die sich Mühe machen deinen Blog-Beitrag zu lesen und dann sogar noch die Zeit nehmen etwas zu verfassen in Form von „@FrankieTNG: Ich sag mal so: Wir beide werden keine Freunde mehr. “ anzugehen.
DAS ist wirklich unprofessionell, es ist nicht neutral und würdigt in keiner Weise, dass sich jemand die Mühe gemacht hat auf etwas aufmerksam zu machen.
Du solltest wirklich lernen mit Feedback umzugehen. Das ist nicht schwierig und hilft, dass du nicht noch mehr Leute vor den Kopf stößt.
Hallo Sebastian. Ich nehme jede Form von Kritik an. Allerdings lasse ich es mir nicht gefallen, WIE diese angebracht wird. Wer der Meinung ist, seine Meinung zu bringen, muss damit leben, dass ich mich dazu äußere. Wer nicht ordentlich mit mir oder anderen Menschen in der Kommentarspalte spricht, hat kein Anrecht drauf, dass ich auch professionell freundlich bleibe. Ich bin kein Verkäufer. Mangelnde Kritikfähigkeit vorwerfen – damit versucht man es dann immer.
„Er ist zwar recht oberflächlich, allerdings wird man über Neuigkeiten informiert. Für fundierte Infos besuche ich andere Webseiten bzw. bilde mir eine Meinung auf anderer Basis.“ Netter Versuch.
Schade.
Hi caschy, danke dass du dir die Zeit genommen hast zu antworten. Wie ich lese hast du nichts von Feedback-Kultur jemals gehört.
Ich bin aus deinem Blog raus. Ich wünsche dir trotzdem noch alles gute. Schade, dass sich unsere Wege nach so langer Zeit trennen.
Ich versteh deinen Kommentar nicht. Erläutere mal bitte.
Scheint aber mal funktioniert zu haben gemäß Kommentare. Ich habe die App auch mal gerade getestet – alles an Cloud diensten schlägt fehl. Das ist ein heftiger und peinlicher Bug. Das OCR funktioniert aber recht zuverlässig.
Leider gibt es die Windows-Desktop-Variante doch nur im Abo-Modell, schade, aber nein danke.
Docutain soll ja eine Dokumentenverwaltungssoftware sein. Aber halt nicht für macOS, sondern nur iOS und Windows. macOS wird auch nicht kommen, gibt zumindest keine Pläne. Die Entwickler werden schon seit 2 Jahren danach gefragt und vor 1-2 Wochen kam dann diese Ansage.
Es gibt PDF Archiver, was recht gut ist, wenn man sowas automatisieren will.
@Basti: Bei mir hat sich nichts verändert, alles so wie schon x Mal beschrieben. PCR auf PDFs und in Ordner geworfen. Findet man über die Textsuche so immer wieder 🙂
Für die Desktop-Version wird bei mir ab November eine Abo-Gebühr von 4,99 pro Monat fällig.
Außerdem lassen sich im Desktop mit der kostenlosen temporären Version angelegte Datensätze, die nach Android synchronisiert werden, dort nicht mehr ohne Weiteres ändern. Endlagerung droht nach Ablauf der kostenlosen Frist.
Die Dokumente die in die Cloud gehen, sind unsichtbar? Zumindest finde ich keine.
Sind sie. Es „wird daran gearbeitet“…
Geht mir genauso! Vielleicht Teil der Pro-version?
Ich habe es so verstanden, dass in der Cloud eine verschlüsselte Datenbank vorgehalten wird, die dann synchronisiert wird. Es liegen also keine PDF Dateien im Klartext in der Cloud. Zugriff geht nur über die App. Einzeldokumente lassen sich dann per App freigeben bzw. downloaden oder über die App ebenso lokal (also auf dem Smartphone) abspeichern.
Es sind auch die Cloud Dienste Webdav, Nextcloud, Owncloud verfügbar
Nutze Docutain schon seit knapp einem Jahr, nach testen der verschiedensten OCR Scannern. Bin absolut zufrieden, kann man echt empfehlen!
Bin momentan allerdings auch auf der Suche nach einer gescheiten Dokumentenverwaltungssoftware, wie auch Basti im obigen Kommentar fragt! Was sind eure Empfehlungen?
Office‘n Pdf nutze ich seit Jahren auf dem PC
Ich auch und bin sehr zufrieden mit Office-N-PDF. Vor allem weil man sehr einfach insbesondere auch wieder exportieren kann. Es besteht keinerlei Abhängigkeit und könnte jederzeit wechseln. Muss man aber nicht.
Wie sieht es mit den Dateigrößen aus? Habe schon alle möglichen Apps ausprobiert aber alle brauchen so zwischen 300kb (SW) bis 2MB (Farbe) pro Seite. Mein Einzugsscanner braucht (bei besserer Qualität) nur ca. ein fünftel davon.
Habe ich gerade Mal getestet und einen einfachen Brief im DIN A4 Format eingescannt.
Scanqualität „Hoch“ + Farbe = 218KB
Scanqualität „Mittel“ + Grau = 117KB
Es gibt noch weitere Qualitätsstufen: „Sehr hoch“ und „niedrig“. Wobei „Mittel“ eigentlich qualitativ schon zu schlecht ist, meiner Meinung nach.
Das gleiche Dokument habe ich auch noch über die „Dokument Scannen“-Funktion der „Dateien“-App eingescannt. Das war dann 3,6MB groß. Absolut sinnlos diese Funktion.
Danke! Das ist ja gar nicht schlecht – werde ich die App mal ausprobieren.
…. und dann Ergebnis hier posten … 😀 … ?
Eine Textseite: 250kB in Graustufen und 960kB in Schwarz-Weiß, beides in Qualität „Hoch“, denn wie Philipp schon schreibt ist „Mittel“ zu schlecht. Mit Einzugsscanner sind es nur 79kB bei 300 dpi SW.
Schade dass die SW Scans so aufgebläht sind, anscheinend haben sie dafür keine vernünftige Komprimierung. Graustufen eignet sich zum Archivieren von Dokumenten leider nicht, wegen der Kontrastproblematik und den sichtbaren JPEG-Komprimierungsartefakten.
ecoDMS
Hab die App in den letzten Monaten ausprobiert und mit anderen verglichen (ScanBit, Dropbox, Office Lens, Scanner Pro, Genius Scan…). Die Scanergebnisse und der Workflow (Scan-Vorgang, Nachbearbeitungsoptionen, automatischer Cloud-Upload) gefielen mir auch bei der Pro-Version nicht so gut. Nutze daher weiter ScanPro und Genius Scan).
Gefällt mir, hab allerdings kaum Erfahrungen.
Stieß beim ersten Gebrauch auf
‚The forest of Docutain
Docutain is the central document management system for the simple and secure digitization and organization of all your documents.‘
Weiß jemand was dazu?
Sehe ich es richtig, dass die Dokumente nicht direkt als PDF, etc. auf dem Cloudspeicher abgelegt werden, sondern in einer Datenbank? Ich habe es mal mit Dropbox versucht.
Dort werden dann drei Ordner (Database, Documents und Queue) angelegt. In den „Documents“ finde ich dann Dateien wie 1_10001_0_0.DAT
Die Dateien helfen mir im ersten Schritt ja bei der Weiterbearbeitung z.B. auf deinem Windows-PC nicht groß weiter.
Kann man das ändern? Oder ist dies nur durch den (kostenpflichtigen) Windows-Client möglich?
Das fände ich ziemlich schade. Mir gefällt die App – besonders dessen Geschwindigkeit – sonst recht gut.
Sonst muss ich wohl bei Scanner Pro bleiben.
Dort habe ich lediglich immer wieder das Problem, dass die Synchronisierung mit Dropbox nicht so recht läuft. Mal geht’s, mal nicht.
Ich hatte das auch erst gesucht: in den Einstellungen des App gibt es einen Schalter „Dokumente auf dem Gerät als PDF öffentlich speichern“ – diese können dann ohne die App geöffnet werden (und mit deinen Windows Rechner gesynct werden).
Prima, danke.
Hatte mir unter „öffentlich speichern“ irgendwie etwas anderes vorgestellt.
Schade, dass diese Funktion eine „Pro“-Funktion ist. – Aber vielleicht werde ich die 4,99 Euro mal investieren.
Nutze wenn überhaupt Office Lens. Meist nutz ich mein Brother AIO.
Hi, Marvin von Docutain hier. Bei den Cloud-Problemen handelt es sich um Einzelfälle, grundsätzlich funktionieren alle Cloudanbieter fehlerfrei. Bei allen die Probleme haben wäre es super, wenn ihr euch an support@docutain.de wendet. Nur dann können wir die Probleme auch lösen. PDF speichern in der Cloud haben wir auf der ToDo-Liste. Mit Docutain habt ihr gemeinsam mit uns die Möglichkeit, zum Klimaschutz beizutragen. Indem ihr Dokumente speichert, sammelt ihr Bäume, die dann auf der ganzen Welt gepflanzt werden. Mehr dazu unter docutain.de/klimaschutz
Mal ab vom vom Greenwashing, habe ich das jetzt richtig verstanden, euer Unternehmen ist laut eurer Website seit über 20 Jahren im Bereich Dokumentenarchivierung tätig, aber eine solch fundamentale Funktion wie die direkte, automatische Archivierung von PDFs habt ihr bisher nur „auf der ToDo-Liste“? Das heißt, ich wäre aufgrund des proprietären oder verschlüsselten Formates für den Zugriff auf meine Dokumente zwingend darauf angewiesen, dass es die App auch in Zukunft (hoffentlich) noch lange gibt, sonst ist Essig mit meinen Dokumenten?
Wir sind so lange im b2b Geschäft tätig. Das ist eine ganz andere Welt als bei b2c mit Docutain. Dass das öffentliche Speichern von PDF eine fundamentale Funktion ist, sehen wir nicht so. Unser Ziel ist es, dass man seine Dokumente vollständig mit Docutain verwaltet und eben nicht mehr einfach PDF Dateien in irgendwelchen Ordner rumliegen hat. Selbstverständlich gibt es Anwendungsfälle, bei denen zugängliche PDF sinnvoll sind, z.B. wenn man einen Mac nutzt, daher werden wir das auch noch liefern.
Das hätte Marvin beantworten sollen: In den Einstellungen des App gibt es einen Schalter „Dokumente auf dem Gerät als PDF öffentlich speichern“ – diese können dann ohne die App geöffnet werden. Ist es das, was du meintest?
Möglicherweise, sofern dieser Schalter dann stets für alle eingescannten Dokumente gilt und nicht die Dokumente einzeln exportiert werden müssen. Das Synchronisieren mit einem Speicherort meiner Wahl (NAS, Cloud) würde ich dann mit einem Dateimanager separat machen.
BTW: Mir scheint hier der Begriff „öffentlich“ falsch benutzt zu werden. Öffentlich bedeutet im deutschen Sprachgebrauch „der Allgemeinheit zugänglich, für alle benutzbar“. Hierüber entscheidet in diesem Kontext jedoch erst einmal der Speicherort, ob und für wen dieser zugänglich ist und nicht das Dateiformat. Begriffe wie „unverschlüsseltes PDF“ oder „Standard-PDF“ wären treffender.
Vielen Dank für die Vorschläge bezüglich Begriffe! Wenn man die Option für die öffentlichen PDF aktiviert, werden ab diesem Zeitpunkt neu gespeicherte Dokumente als PDF im Ordner „Docutain“ im Basisverzeichnis des Gerätes gespeichert. Eventuell bereits vorhandene Dokumente werden aktuell nicht rückwirkend dort als PDF gespeichert. Dies wird mit einer zukünftigen Version kommen.
Nutzt hier eigentlich jemand fileee (oder hat es benutzt) und kann was dazu bzw im Vergleich sagen?
Fiel mir gerade so ein, hatte das damals bei kickstarter gebackt, die scanbox steht noch hier in der Ecke (ist auch nur ein teurer Schuhkarton mit LED Streifen) aber dann iwie doch nie genutzt. Ich glaub das lag auch an der Preispolitik von denen…
Ich habe filee benutzt. Aber das ist eine Firma, welche Kundenwünsche, wie bspw. 2FA, konsequent seit Jahren ignoriert aber trotzdem Versprechungen raus haut. Ich glaube dafür haben die Textbausteine, die sich automatisch in Kommentare im Forum eintragen.
Hat mich insgesamt nicht überzeugt, habe kein Vertrauen zu dieser Firma aufbauen können.
Doxisafe
Wenn es um eine sehr gute Datenkompression des PDFs und hervorragende OCR (Deeper und nicht Googles Tesseract) geht, dann empfehle ich die kostenlose Android App doxisafe von der CIB GmbH. Ist quasi der Mitbewerber von fileee und hat auch eine ebensolche Scannerbox im Angebot. Unter doxisafe.me hat man dann auch gleich eine Mini-Dokumentenverwaltung bei der man genau hier auch andere Clouds einbinden kann; bei der App ist momentan leider nur Google Drive vorgesehen (Anfrage gesendet). Die Dateien sind wirklich sehr klein und hervorragend durchsuchbar.
Hmm.
Die App ist kostenlos, enthält keine Werbung, und kann ohne Anmeldung genutzt werden. Es gibt keine kostenpflichtige In-App-Käufe und keine Abos.
Zudem gibt es sogar eine kostenlose deutsche Telefon-Hotline.
Also, wo ist der Haken? Niemand hat etwas zu verschenken.
„Ist etwas kostenlos, bist du das Produkt!“
2 Tracker von der Google-Api lassen sich leider nicht vermeiden, es sei denn man verzichtet auf den Zugang zu Google-Drive. Ansonsten verdient die CIB GmbH aus Karlsruhe eher ihr Geld mit den Fachprogrammen für RechtsanwAlte und Steuerkanzleien, etc. Besonders interessant ist aber die Entwicklung der Deeper-OCR, die mMn sehr viel besser als Tesseract arbeitet, welches fast ausschließlich alle anderen Scan-Apps verwenden.
Ich hab DoXisafe jetzt mal getestet. Überzeugt hat mich das Ergebnis nicht.
Für eine DIN A4 Seite Text spuckt die App in den Standard-Einstellungen ein 1,7MB großes PDF aus. Das ist viel zu viel.
Meine Dokumente sind alle (!) Dokumente inklusive OCR-Layer unter 300kb. Ich wähle das Format „SW-1 kompakt“ aus.
Ich habe die iOS App ausprobiert. Da gibt es dieses Format nicht.
Und OCR mit DeepER benötigt laut Einstellungen „eine gute Internet-Verbindung“, das funktioniert also offensichtlich nicht on-Device.
Und wenn ich während des Scannens den Punkt „Doxibox“ auswähle, stürzt die App reproduzierbar ab.
Ich bleib dabei, mich überzeugt das nicht.
https://deeper.cib.de/
Hier ist es beschrieben. Jap die nutzen ne AI im Hintergrund.
Korrektur: ich habe das Format doch gefunden. Es ist nicht unter den wählbaren Ausgabe-Formaten und auch nicht in den Einstellungen zur Kompression oder Scanqualität, wo ich nachgeschaut hatte. Es handelt sich eher um ein Filter-Preset, dass man erst nach dem Scannen auswählen kann. Aber damit lassen sich tatsächlich sehr kleine und qualitativ gute Scans erstellen.
Ich benutze seit einigen Jahren das für Privatanwender kostenlose CompuSME. Das arbeitet aber ausschließlich im lokalen Netzwerk, ohne Cloud-Anbindung. Die Oberfläche ist allerdings sehr altbacken und ein Sync mit iOS geht nicht. Man kann unter iOS die komplette Datenbank auf das Gerät in die App laden und dort die Dokumente betrachten. Deshalb überlege ich ernsthaft auf Docutain umzustellen.
„Juni 2020: CompuDMS Free wird nicht länger angeboten.“
„Ab sofort arbeitet auch die auf 1 Benutzer beschränkte Free-Version analog zu den kostenpflichtigen Produktvarianten Professional und Cloud datenbankbasiert und nicht mehr mit Container-Dateien. „