Google Streetview und Captchas: beide profitieren voneinander
Habt Ihr Euch schon einmal gefragt, wie Google es schafft, den Ort zu einer bestimmten Adresse zu bestimmen? Ich ehrlich gesagt nicht, Google erklärt es aber trotzdem. Das Ganze hat etwas mit dem automatischen Lösen von Captchas (die wüsten Zahlen- und Buchstaben-Kombinationen, die einem das Leben echt schwer machen können) zu tun. Google ermittelt so nämlich die Hausnummern aus Streetview-Aufnahmen und kann so exakt sagen, wo sich eine bestimmte Adresse befindet.
Mit einem neuen System, das Technologien von Streetview und reCAPTCHA nutzt, können Hausnummern zu 90% erkannt werden. Der neue Algorithmus ist sogar in der Lage 99% der Captchas von reCAPTCHA zu lösen. Unten seht Ihr vier Beispiele, die gelöst wurden. Bei einem davon hätte ich Probleme gehabt, es zu lösen. Die Fähigkeit, die Captchas mit einem Computer zu lösen, wirft natürlich Probleme auf. Schließlich will man mit einem solchen System genau dies verhindern.
Das ist der Grund, warum Google sich nicht ausschließlich auf die Verzerrung von Text verlässt, sondern weitere Maßnahmen ergreift, um Mensch und Maschine auseinanderhalten zu können. Durch die neuen Erkenntnisse, wird sich künftig sowohl das Captcha-System verbessern lassen, ebenso wie auf Google Maps präzisere Ortsangaben ermöglicht werden.
Artikel ist furchtbar schlecht erklärt.
@Tom
Google identifiziert Hausnummern aus StreetView Aufnahmen mittels Algorithmus zur reCAPTCHA Lösung. Was gibt es mehr zu erklären?
Ich hasse diese Dinger, das links unten, könnte mit zwei ‚r’s anfangen oder mit einem ’n‘, es könnte sogar fast ein ‚m‘ sein.
Zitat: „Der neue Algorithmus ist sogar in der Lage 99% der Captchas von reCAPTCHA zu lösen.“ Also arbeitet Google daran, die Captchas automatisiert zu lösen um auch in geschützte Bereiche vollautomatisiert reinzukommen…
Zitat: „Das ist der Grund, warum Google sich nicht ausschließlich auf die Verzerrung von Text verlässt, sondern weitere Maßnahmen ergreift, um Mensch und Maschine auseinanderhalten zu können.“ – sagt eigentlich das exakte Gegenteil aus…
Zitat: „Durch die neuen Erkenntnisse, wird sich künftig sowohl das Captcha-System verbessern lassen“ – Also, noch mal kurz gefasst: Google will reCaptcha automatisiert von maschinen lösen lassen um zu lernen, wie man eben diese Captchas so einstellt, dass es eben nicht mehr geht? Oder was oder wie? – Oder soll das hier nur bedeuten, dass Google Streetview-Ausschnitte in reCaptcha mit den Nutzereingaben verknüpft und dadurch die Texterkennung verbessert?
@Tom: Danke, sehe ich genau so.
Schlechtester Artikel den ich gelesen habe, man hätte es auch noch kürzer schreiben können:
Weil Sie es können.
„nämlcih“
Verstehe den Artikel auch nicht so ganz. Davon abgesehen: Google nutzt doch schon seit langem die Hausnummern aus Maps.
Ich wollte mir letztens eine Emailadresse auf gmx.com anlegen. Ich habe ungelogen nach einer halben Stunde frustriert aufgegeben, da ich keines der Captchas lösen konnte.
War nicht irgendwann mal die Rede davon, dass Google umstellen wollte auf Katzen und Hundebilder? Menschen könnten ziemlich leicht den Unterschied erkennen, Computersysteme dafür aber so gut wie nicht?
@Lars Catcaptchas sind zu einfach – Google kennt alle Catcontent-Bilder des Internets – ein kleiner Algorithmus, wie er ja jetzt schon in der Bildersuche ist und das Ding ist gegessen…
Google’s Street View Team hat einen Algorithmus entwickelt, mit dem es möglich ist 90% der Hausnummern korrekt zu erkennen.
Der gleiche Algorithmus erkennt aber auch 99% der reCAPTCHAs.
Dies hat Google vor 1 Jahr zum Anlass genommen die reCAPTCHAs zu verbessern. Desweiteren hat man dadurch erkannt, dass reCAPTCHAs alleine nicht ausreichend sind, so dass man weitere Mechanismen eingebaut hat, um Computer erkennen.
Das war ganz kurz zusammen gefasst der Inhalt.
PS: nachdem ich den Artikel noch einmal gelesen habe muss ich feststellen, dass Sascha da eine Menge Mist hingeschrieben hat. Steht du auf jeden Fall nicht im englischen Original.
Im folgenden gebe ich euch einen Tipp bezüglich Recaptcha ^^
Recaptcha basiert ja darauf dass Google immer 2 Wörter / Zahlenkombinationen vorschlägt, aber eines davon hat Google selber erstellt und kennt die Lösung.
Meistens sind Kauderwelsch Wörter die auf englisch keinen Sinn ergeben, von Google erstellte Wörter, welche auch überprüft werden ob sie stimmen.
Ihr könnt also bei Captchas wo eins von beiden nur aus zahlen besteht irgendetwas eingeben, denn das kennt Google nicht und kann somit nicht sagen ob ihr es richtig erkannt habt ;D
Hä
Ich finde Captchas besser, bei denen ich keinen Text entziffern und ihn eintippen muss. Die gleich Funktion lässt sich auch mit Bildern bewerkstelligen, also in etwa: „Klicken Sie auf das grüne Dreieck“. Das ist viel schneller gemacht und ohne Tastatur zu lösen.
@laderio: Danke, jetzt hab ichs verstanden. Aus dem Artikel bin ich echt nicht schlau geworden. Muss aber sagen, dass Captchas immer schlimmer werden. Vor nem Jahr oder so hab ich normalerweise keine Probleme gehabt, aber in letzter Zeit ist es nicht selten, dass ich da mal 5-6 Versuche brauche, weil man einfach nichts mehr erkennen kann…
@laderio: danke, da weiß einer wie man es richtig macht.
Finde ich auch nicht wirklich neu… und ist auch gleich logisch, dass dies so abgehandelt wird.
Ich werde alleine beim Betrachten der vier Beispielbilder schon aggressiv.
Hier die Veröffentlichung von Google: http://arxiv.org/pdf/1312.6082v4.pdf
Für die Leute, die sich mit den technischen Details beschäftigen wollen (Deep Learning, neuronale Netze…)
Warum steht bei Facebook immer „von Carsten Knobloch“ und nicht der Name des Autors? Könnte so manchen Klick ersparen…
Ist es nicht eher so: mit dem Algorithmus erstellten Cantona differenziert Google Menschen von Maschinen und mit dem streetviewbild lässt sich Google von Menschen die schlecht erkennbaren Hausnummer validieren. Und Letzteres hat eine Erfolgsquote von 90%….
„Algorithmus erstellten Cantona“ sollte eigentlich: algorithmisch erstellte captchas heißen.