Ausbaufähig: BookScanner Pro: Smart Book Scanner App with OCR

bookscannerEs gibt eine neue App auf dem Markt. Es dreht sich hierbei um eine Scanner-App mit OCR, die trotz des englischen Namens deutsch lokalisiert ist. BookScanner Pro: Smart Book Scanner App with OCR ist kostenpflichtig, wie meistens, wenn es sich um eine OCR-App handelt. Das Scannen von Büchern ist aufwändig und nischig, dementsprechend gibt es nicht den riesigen Markt. Mit knapp 20 Euro lässt sich ABBY den Spaß gut bezahlen. Was die App macht, ist recht schnell erklärt. Man legt ein Buch hin und fotografiert eine Doppelseite nach der anderen.

img_5908

Theoretisch sollte die App nun dafür sorgen, dass die Einzelseiten extrahiert und begradigt werden. Des Weiteren steht das wichtige OCR in der App zur Verfügung, Ergebnisse können in diversen Formaten gespeichert werden – auch bei Cloud-Anbietern wie Dropbox oder Google. Ich schnappte mir zum Test ein Buch der drei ???. Stadt der Vampire, netter Schmöker. Ausreichend große Buchstaben, eigentlich leichte Kost für eine Scanner-App. Das Buch wird aufgeklappt, die App bietet zudem Hilfslinien an, damit richtig geknipst werden kann.

Schräg wird das nichts

Schräg wird das nichts

Erste Erkenntnis: Das Ergebnis ist größtenteils ok, bei einigen Seiten sieht man die Schrägen, bedingt durch nicht ganz plan aufliegende Seiten. Erste Überraschung: Die Seiten werden zu einem „Bookserver“ geschickt. Das gleiche passiert auch bei OCR – und je nach Anbindung wartet man.

Die Erkennungssprache kann angegeben werden, ebenso das Format bei der Ausgabe angegeben werden. Durchsuchbares PDF, EPUB, Doc und Co. Alles drin. Die Erkennung per OCR und Umwandlung in Docx war richtig schlecht, wenn das Buch eine Seite hatte, die nicht ganz gerade war.

Durchsuchbares PDF

Durchsuchbares PDF

Was aber funktionierte, das war die Erkennung von Texten bei einem Export in ein durchsuchbares PDF. Kurzes Fazit? Hätte damit gerechnet, dass lokal die Aufgaben erledigt werden, keine externen Server behelligt werden. Interessierte sollten die Bücher tunlichst gerade halten, wenn sie späteren OCR-Export in Reintext wünschen, sonst wird es nervig.

https://itunes.apple.com/app/bookscanner-pro/id1173444390?mt=8

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Seit 2008 ist es Beruf(ung). Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

4 Kommentare

  1. Hm, es könnte sein das bei dem Konzept mit zentralen OCR-Server eine „DeepLearning“ Texterkennung dahinter steht. D.h. es könnte sein, dass durch Benutzung und dann durch die Verbesserungen der Benutzer die Texterkennung besser wird.
    Ist aber nur eine Vermutung von mir. Obs wirklich so läuft weiß ich nicht.

  2. OCR ist eine wirklich anspruchsvolle Aufgabe, die ich den heutigen Smartphones nicht zutrauen würde. Abby ist einer der beiden großen Anbieter solcher Software.
    Was mich interessieren würde ist, ob man
    a) auch damit auch ohne Internetverbindung scannen kann (und das Ergebnis dann eben erst später, mit Verbindung, bekommt) und
    b) ob das System auch alte Schriften erkennt. Dafür gibt es bei Abby nämlich eine Software, die aber nicht auf normalem Wege zu erhalten ist.

  3. Abbyy ist in der Tat ziemlich gut was OCR und automatische Korrektur angeht. Mittlerweile kommt da auch Scanbot ran, kann offline OCR, erkennt aber keine Spalten.

    Die Fine Scanner Pro App von ABBYY hat alles inkl. der Buchoption. Kostet 40 Latten, ist aber öfters mal für 3,99 zu haben. Teilweise sogar mehrmals im Monat.

  4. @Kalle
    Danke für den Hinweis. Ist wohl momentan wieder der Fall. Dachte erst, ich hätte noch kürzlich dem Preis von 40€ irgendwas gelesen, als ich es heute für 4,49€ im Play Store sah.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.