Ohne Geotags: Google-AI „PlaNet“ erkennt am Hintergrund, wo ein Foto geschossen wurde



----
Ohne Geotags: Google-AI „PlaNet" erkennt am Hintergrund, wo ein Foto geschossen wurde
// t3n News

Falls ihr euch partout nicht daran erinnern könnt, wo ihr ein bestimmtes Urlaubsfoto geschossen habt, kann Google in Zukunft helfen. Denn eine neue Google-Technologie, die sich künstliche Intelligenz zunutze macht, hilft dabei und setzt nicht auf das Hauptmotiv, sondern den Fotohintergrund.

PlaNet: Googles AI erkennt Orte ohne Zuhilfenahme der Geodaten

Mit Googles eigenem Foto-Service „Google Fotos" ist es schon möglich, Objekte wie Tiere, Strände oder Berge zu erkennen. Das genügt Google aber offenbar nicht, denn ein neuer Algorithmus, entwickelt unter Tobias Weyand, soll künftig den konkreten Aufnahmeort eines Fotos bestimmen. Hierfür wird aber nicht auf die Metadaten oder die womöglich hinterlegten GPS-Daten eines Bildes zurückgegriffen, sondern man hat einer Deep-Learning-Maschine beigebracht, aus dem Foto selbst zu erkennen, wo es aufgenommen wurde.

PlaNet : Die Welt wird in viele Raster unterteilt. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)
PlaNet : Die Welt wird in viele Raster unterteilt. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)

Hierfür hat Weynand mit seinem Entwicklerteam (PDF) die Welt in 26.000 Quadrate aufgeteilt, die sich anhand der Anzahl der zur Verfügung stehenden Fotos in der Größe unterscheiden. Große Städte, von denen mehr Fotos zur Verfügung stehen als beispielsweise bei einer Wüstenregion, sind in kleinere Raster aufgeteilt als letztere. Ozeane und Polar-Regionen wurden nicht in das Raster einbezogen.

Als nächstes wurde eine Datenbank aus 126 Millionen Fotos mit Ortsdaten aus Google Plus und Street View erstellt und dem Rastersystem zugeordnet, wodurch eine visuelle Weltkarte entstanden ist. Mit 91 Millionen der Fotos wurde ein neuronales Netzwerk trainiert, nur anhand des Bildes zu erkennen, wo es aufgenommen wurde. Die restlichen 34 Millionen Fotos wurden zur weiteren Kalibrierung der Bilderkennungs-AI verwendet.

PlaNet: Ortserkennung ohne Metadaten. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)
PlaNet: Ortserkennung ohne Metadaten. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)

PlaNet: AI errät Orte besser als der Mensch

Im nächsten Schritt zog man 2,3 Millionen Fotos aus dem Bildernetzwerk Flickr heran: Die AI sollte erkennen, wo sie aufgenommen wurden – ohne Zuhilfenahme der Geodaten. Anhand der bekannten Datensets versucht die Maschine zu erraten, wo die Fotos aufgenommen wurden. Hierfür versucht die AI nicht nur markante Landschaftspunkte oder Bauwerke zu erkennen, sondern es werden auch Pflanzen, Tiere, das Wetter, Straßenmarkierungen und architektonische Details in den Prozess einbezogen.

Im Spiel Geoguessr macht PlaNet eine vergleichsweise gute Figur. (Screenshot: Geoguessr)
Im Spiel Geoguessr macht PlaNet eine vergleichsweise gute Figur. (Screenshot: Geoguessr)

Die Resultate waren noch nicht überragend, aber schon besser als sie ein Mensch hätte zuordnen können. PlaNet konnte 3,6 Prozent der 2,3 Millionen Fotos auf die Straße genau verorten, immerhin 10,1 Prozent der Bilder konnte die AI Städten korrekt zuordnen. Immerhin: Die Deep-Learning-Maschine konnte 28,4 Prozent aller Fotos dem richtigen Land zuordnen und 48 Prozent dem korrekten Kontinent.

Im Kopf-an-Kopf-Rennen mit Menschen hatte PlaNet die Nase vorn. Im Spiel Geoguessr, das für jeden frei spielbar ist, hat PlaNet gegen Menschen 28 von 50 Runden mit einer mittleren Distanz zum richtigen Ort von 1131,7 Kilometern für sich entscheiden können. Bei den menschlichen Gegnern lag die Distanz zum Ratepunkt bei 2.320,75 Kilometern.

via www.technologyreview.com



---- 
Sigurd A.Röber

Kommentare

Beliebte Posts