Google’s Gemini hat Pokémon Blue besiegt (mit ein wenig Hilfe)
Das teuerste KI-Modell von Google scheint einen bedeutenden Meilenstein erreicht zu haben: Es hat ein 29 Jahre altes Videospiel besiegt.
Gestern Abend postete der CEO von Google, Sundar Pichai, triumphierend auf X: „Was für ein Finale! Gemini 2.5 Pro hat gerade Pokémon Blue abgeschlossen!“
Um klarzustellen: Der Livestream „Gemini spielt Pokémon“ wurde von einem 30-jährigen Software-Ingenieur, der nicht mit Google verbunden ist und Joel Z. heißt, erstellt. Aber die Führungskräfte von Google haben das Bemühen unterstützt.
Logan Kilpatrick, der Produktleiter von Google AI Studio, postete letzten Monat, dass Gemini „große Fortschritte beim Abschluss von Pokémon“ mache und bereits seinen 5. Abzeichen verdient habe (das nächste beste Modell hat bisher nur 3, jedoch mit einem anderen Agenten-Harness). Pichai scherzte: „Wir arbeiten an API, Künstlicher Pokémon-Intelligenz :)“
Warum Pokémon? Im Februar hob Anthropic den Fortschritt seiner Claude-KI-Modelle hervor, die in „Pokémon Red“ Fortschritte machten. Claude’s „erweiterte Denk- und Agentenausbildung“ gibt ihm einen großen Vorteil bei „unvorhergesehenen“ Aufgaben wie dem Spielen eines klassischen Spiels.
Obwohl Gemini Fortschritte gemacht hat, scheint Claude „Pokémon Red“ noch nicht besiegt zu haben. Bedeutet das, dass Gemini objektiv besser im Spiel ist? Auf seiner Twitch-Seite forderte Joel Z die Zuschauer auf: „Bitte betrachtet dies nicht als Maßstab dafür, wie gut ein LLM Pokémon spielen kann.“
Beide KI-Modelle benötigen Hilfe, um das Spiel zu spielen – dabei kommen die erwähnten Agenten-Harnesses ins Spiel, die den Modellen Spiel-Screenshots mit zusätzlichen Informationen überlagern, sodass das Modell entscheiden kann, wie es reagieren soll.