Microsoft aktuell führend bei Bilderkennungs-Software

artikel_microsoftMicrosoft Research hat sich bei dem sechsten, jährlichen ImageNet-Bilderkennungs-Wettbewerb in zahlreichen Kategorien den ersten Platz gesichert. So stellte man mit der eigenen Software mehrmals die Techniken von Google, Intel, Qualcomm und Tencent in den Schatten. Auch neue, auf Bilderkennung spezialisierte Startups sowie Universitäten mussten sich Microsoft geschlagen geben. Das siegreiche System nennt sich „Deep Residual Learning for Image Recognition“ und stammt von den Microsoft-Mitarbeitern Kaiming He, Xiangyu Zhang, Shaoqing Ren und Jian Sun. Die technischen Hintergründe sind sehr komplex, denn es werden neurale Netzwerke mit 150 Layern eingesetzt, welche ihre Genauigkeit auf Zeit verbessern bzw. quasi dazulernen.

Microsoft hat die Techniken für Bilderkennung einer breiten Masse eher verspielt vorgestellt – etwa mit einer App, die anhand von Fotos Aussagen darüber trifft, wie alt die abgelichtete Person in etwa wirkt. Die Ergebnisse sind teilweise sehr belustigend und rankten sich bei mir von 25 bis 45 Jahren, treffen aber manchmal auch gut auf den Punkt. Zumal Microsoft an der Erkennung immer weiter tüftelt. Im Rahmen des Wettbewerbs von ImageNet ging es aber vielmehr darum, mit der eigenen Software in 100.000 von Flickr und Suchmaschinen übernommenen Bildern Objekte auf den Fotos korrekt zu erkennen und zu klassifizieren. Die Gegenstände sollten in rund 1000 Kategorien eingeordnet werden. Darunter waren beispielsweise Bereiche wie „Tarantel“, „iPod“, „Modem“ oder „Spielzeugladen“. Die Software, welche die wenigsten Fehler machte, gewann natürlich.

microsoft_logo

Microsoft Research erzielte mit seinen Techniken eine Fehlerrate von 3,5 % bei den Klassifizierungen und eine Rate von 9 % bei der allgemeinen Erkennung / Lokalisierung. Wer sich alle Ergebnisse ansehen möchte, erhält hier einen detaillierten Überblick. In den Jahren zuvor lagen übrigens Google, das Startup Clarifai sowie NEC an der Spitze. Microsoft Research hat somit aufgeholt und scheint großes Interesse an den Techniken zur Bilderkennung zu besitzen. Baidu wurde übrigens disqualifiziert, da das chinesische Unternehmen zu viele Bewerbungen eingereicht hatte.

(via VentureBeat)

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hauptberuflich hilfsbereiter Technik-, Games- und Serien-Geek. Nebenbei Doc in Medienpädagogik und Möchtegern-Schriftsteller. Hofft heimlich eines Tages als Ghostbuster sein Geld zu verdienen oder zumindest das erste Proton Pack der Welt zu testen. Mit geheimniskrämerischem Konto auch bei Facebook zu finden. PayPal-Kaffeespende an den Autor.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

6 Kommentare

  1. Vielen Dank für den Bericht, der doch technischer ist als ich erwartet habe. An der Uni sind diese Deep Neural Networks aktuell ein großes Thema und es wird in viele Richtungen damit gearbeitet.

    Es geht dabei nicht unbedingt nur um die Kategorisierung von Alltagsgegenständen, sondern beispielsweise auch für autonome Fahrzeuge um die Erkennung von Straße und Nicht-Straße. Aber gerade beim Kategorisieren ist beeindruckend, dass diese Algorithmen nicht einfach nur „Katze“ erkennen könnten, sondern auch Unterarten, wie „Perserkatze“, richtig zuordnen.

    Es gibt einige Personen, die in den DNNs die ultimative Machine Learning Lösung sehen, aber vermutlich wird man dann auch erstmal wieder warten müssen, bis der Hype vorbei ist, um die finalen Schlüsse zu ziehen. Ist aber durchaus sehr beeindruckend, was da so geht.

    P.S.: Im Deutschen heißt es glaube ich „neuronale“ Netze und nicht „neurale“ Netze.

  2. Microsoft wird es schon irgendwie schaffen, diesen Vorsprung an die Wand zu fahren. Das hat bis jetzt immer geklappt.

  3. Hat Google dieses Jahr überhaupt mitgemacht? Falls ja: Unter welchem Namen finde ich die Einträge in der Resultate-Tabelle?

  4. @Markus

    Team: ReCeption
    Member: Jianmin Chen

  5. Wenn man sich die Namen der Teilnehmer so anschaut scheinen neuronale Netze ausschließlich von Asiaten dominiert zu werden.

    P.S: schön mal wieder so einen durchaus technischen Beitrag auf dem Blog zu finden !

  6. @Stephan: 2 Einträge für Google verglichen mit über 20 für Microsoft sprechen aber nicht wirklich für eine ernsthafte Teilnahme von Google…

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.