Microsoft aktuell führend bei Bilderkennungs-Software
Microsoft Research hat sich bei dem sechsten, jährlichen ImageNet-Bilderkennungs-Wettbewerb in zahlreichen Kategorien den ersten Platz gesichert. So stellte man mit der eigenen Software mehrmals die Techniken von Google, Intel, Qualcomm und Tencent in den Schatten. Auch neue, auf Bilderkennung spezialisierte Startups sowie Universitäten mussten sich Microsoft geschlagen geben. Das siegreiche System nennt sich „Deep Residual Learning for Image Recognition“ und stammt von den Microsoft-Mitarbeitern Kaiming He, Xiangyu Zhang, Shaoqing Ren und Jian Sun. Die technischen Hintergründe sind sehr komplex, denn es werden neurale Netzwerke mit 150 Layern eingesetzt, welche ihre Genauigkeit auf Zeit verbessern bzw. quasi dazulernen.
Microsoft hat die Techniken für Bilderkennung einer breiten Masse eher verspielt vorgestellt – etwa mit einer App, die anhand von Fotos Aussagen darüber trifft, wie alt die abgelichtete Person in etwa wirkt. Die Ergebnisse sind teilweise sehr belustigend und rankten sich bei mir von 25 bis 45 Jahren, treffen aber manchmal auch gut auf den Punkt. Zumal Microsoft an der Erkennung immer weiter tüftelt. Im Rahmen des Wettbewerbs von ImageNet ging es aber vielmehr darum, mit der eigenen Software in 100.000 von Flickr und Suchmaschinen übernommenen Bildern Objekte auf den Fotos korrekt zu erkennen und zu klassifizieren. Die Gegenstände sollten in rund 1000 Kategorien eingeordnet werden. Darunter waren beispielsweise Bereiche wie „Tarantel“, „iPod“, „Modem“ oder „Spielzeugladen“. Die Software, welche die wenigsten Fehler machte, gewann natürlich.
Microsoft Research erzielte mit seinen Techniken eine Fehlerrate von 3,5 % bei den Klassifizierungen und eine Rate von 9 % bei der allgemeinen Erkennung / Lokalisierung. Wer sich alle Ergebnisse ansehen möchte, erhält hier einen detaillierten Überblick. In den Jahren zuvor lagen übrigens Google, das Startup Clarifai sowie NEC an der Spitze. Microsoft Research hat somit aufgeholt und scheint großes Interesse an den Techniken zur Bilderkennung zu besitzen. Baidu wurde übrigens disqualifiziert, da das chinesische Unternehmen zu viele Bewerbungen eingereicht hatte.
Vielen Dank für den Bericht, der doch technischer ist als ich erwartet habe. An der Uni sind diese Deep Neural Networks aktuell ein großes Thema und es wird in viele Richtungen damit gearbeitet.
Es geht dabei nicht unbedingt nur um die Kategorisierung von Alltagsgegenständen, sondern beispielsweise auch für autonome Fahrzeuge um die Erkennung von Straße und Nicht-Straße. Aber gerade beim Kategorisieren ist beeindruckend, dass diese Algorithmen nicht einfach nur „Katze“ erkennen könnten, sondern auch Unterarten, wie „Perserkatze“, richtig zuordnen.
Es gibt einige Personen, die in den DNNs die ultimative Machine Learning Lösung sehen, aber vermutlich wird man dann auch erstmal wieder warten müssen, bis der Hype vorbei ist, um die finalen Schlüsse zu ziehen. Ist aber durchaus sehr beeindruckend, was da so geht.
P.S.: Im Deutschen heißt es glaube ich „neuronale“ Netze und nicht „neurale“ Netze.
Microsoft wird es schon irgendwie schaffen, diesen Vorsprung an die Wand zu fahren. Das hat bis jetzt immer geklappt.
Hat Google dieses Jahr überhaupt mitgemacht? Falls ja: Unter welchem Namen finde ich die Einträge in der Resultate-Tabelle?
@Markus
Team: ReCeption
Member: Jianmin Chen
Wenn man sich die Namen der Teilnehmer so anschaut scheinen neuronale Netze ausschließlich von Asiaten dominiert zu werden.
P.S: schön mal wieder so einen durchaus technischen Beitrag auf dem Blog zu finden !
@Stephan: 2 Einträge für Google verglichen mit über 20 für Microsoft sprechen aber nicht wirklich für eine ernsthafte Teilnahme von Google…