Ausbaufähig: BookScanner Pro: Smart Book Scanner App with OCR
Es gibt eine neue App auf dem Markt. Es dreht sich hierbei um eine Scanner-App mit OCR, die trotz des englischen Namens deutsch lokalisiert ist. BookScanner Pro: Smart Book Scanner App with OCR ist kostenpflichtig, wie meistens, wenn es sich um eine OCR-App handelt. Das Scannen von Büchern ist aufwändig und nischig, dementsprechend gibt es nicht den riesigen Markt. Mit knapp 20 Euro lässt sich ABBY den Spaß gut bezahlen. Was die App macht, ist recht schnell erklärt. Man legt ein Buch hin und fotografiert eine Doppelseite nach der anderen.
Theoretisch sollte die App nun dafür sorgen, dass die Einzelseiten extrahiert und begradigt werden. Des Weiteren steht das wichtige OCR in der App zur Verfügung, Ergebnisse können in diversen Formaten gespeichert werden – auch bei Cloud-Anbietern wie Dropbox oder Google. Ich schnappte mir zum Test ein Buch der drei ???. Stadt der Vampire, netter Schmöker. Ausreichend große Buchstaben, eigentlich leichte Kost für eine Scanner-App. Das Buch wird aufgeklappt, die App bietet zudem Hilfslinien an, damit richtig geknipst werden kann.
Erste Erkenntnis: Das Ergebnis ist größtenteils ok, bei einigen Seiten sieht man die Schrägen, bedingt durch nicht ganz plan aufliegende Seiten. Erste Überraschung: Die Seiten werden zu einem „Bookserver“ geschickt. Das gleiche passiert auch bei OCR – und je nach Anbindung wartet man.
Die Erkennungssprache kann angegeben werden, ebenso das Format bei der Ausgabe angegeben werden. Durchsuchbares PDF, EPUB, Doc und Co. Alles drin. Die Erkennung per OCR und Umwandlung in Docx war richtig schlecht, wenn das Buch eine Seite hatte, die nicht ganz gerade war.
Was aber funktionierte, das war die Erkennung von Texten bei einem Export in ein durchsuchbares PDF. Kurzes Fazit? Hätte damit gerechnet, dass lokal die Aufgaben erledigt werden, keine externen Server behelligt werden. Interessierte sollten die Bücher tunlichst gerade halten, wenn sie späteren OCR-Export in Reintext wünschen, sonst wird es nervig.
https://itunes.apple.com/app/bookscanner-pro/id1173444390?mt=8
Hm, es könnte sein das bei dem Konzept mit zentralen OCR-Server eine „DeepLearning“ Texterkennung dahinter steht. D.h. es könnte sein, dass durch Benutzung und dann durch die Verbesserungen der Benutzer die Texterkennung besser wird.
Ist aber nur eine Vermutung von mir. Obs wirklich so läuft weiß ich nicht.
OCR ist eine wirklich anspruchsvolle Aufgabe, die ich den heutigen Smartphones nicht zutrauen würde. Abby ist einer der beiden großen Anbieter solcher Software.
Was mich interessieren würde ist, ob man
a) auch damit auch ohne Internetverbindung scannen kann (und das Ergebnis dann eben erst später, mit Verbindung, bekommt) und
b) ob das System auch alte Schriften erkennt. Dafür gibt es bei Abby nämlich eine Software, die aber nicht auf normalem Wege zu erhalten ist.
Abbyy ist in der Tat ziemlich gut was OCR und automatische Korrektur angeht. Mittlerweile kommt da auch Scanbot ran, kann offline OCR, erkennt aber keine Spalten.
Die Fine Scanner Pro App von ABBYY hat alles inkl. der Buchoption. Kostet 40 Latten, ist aber öfters mal für 3,99 zu haben. Teilweise sogar mehrmals im Monat.
@Kalle
Danke für den Hinweis. Ist wohl momentan wieder der Fall. Dachte erst, ich hätte noch kürzlich dem Preis von 40€ irgendwas gelesen, als ich es heute für 4,49€ im Play Store sah.