Google Drive OCR erkennt nun über 200 Sprachen
Optical Character Recognition (OCR) bezeichnet die Texterkennung auf Bildern, in der Regel gescannter Dokumente. Durch OCR ist es möglich, gescannte Dokumente nach ihrem Inhalt zu durchsuchen. Das wird in Google Drive nun noch umfangreicher, Google verkündet die Unterstützung für über 200 Sprachen an. Die Erkennung der Sprache erfolgt dabei automatisch, je besser der Scan eines Dokumentes ist, desto besser auch die Erkennung.
Um ein Dokument mittels OCR auszulesen muss man folgendermaßen Vorgehen. Zuerst ein Bild eines Textes in Google Drive hochladen. Danach einfach per Rechtsklick „In Google Docs öffnen“ anklicken,. Daraufhin erhält man ein Dokument, das sowohl das Bild als auch den reinen Text (wie erkannt) darstellt. Diesen kann man dann bearbeiten.
Das Ganze ist nicht nur im Browser möglich, sondern wird auch von der Google Drive App für Android unterstützt. Cooles Feature, das die Arbeit mit gescannten Dokumenten auf jeden Fall erleichtert, noch besser ist natürlich, dass dies unabhängig von der gescannten Sprache geschieht. Wer sich für die technische Umsetzung interessiert, wird in diesem Blogpost von Google aufgeklärt.
Das ist doch Mist. „Früher“ konnte ich direkt in allen eingescannten PDFs suchen und erkannten Text markieren. Das war genial! Von einen Tag auf den anderen ging das nicht mehr 🙁
Ich finde die OCR Funktion von OneDrive besser.
Gibt es noch andere Cloud Anbieter die OCR für hochgeladene Dateien bieten?
@Tom B: Das konntest du nur, wenn irgendeine Software nach dem Scan eine OCR auf dem Bild gemacht hat. Das kann z.B. Der Adobe Acrobat (nicht Acrobat Reader!).
Oder meintest du speziell Google Drive?
@marco: Das ging einfach so in Drive. Sogar in jpgs, fällt mir wieder ein!
Mit irgendeinem Ramsch-Scanner Dokumente gescannt und PDF hochgeladen und keine 2 Minuten später war alles automatisch indexiert. Das war doch der HAMMER. Ich check’s einfach nicht, dass das weg ist.