
Richard Sutton: Warum KI erst am Anfang steht
Richard S. Sutton, einer der Mitbegründer des Reinforcement Learning und seit Jahrzehnten eine zentrale Figur der KI-Forschung, stellt in seinem YouTube-Vortrag „The Future of AI“ eine unbequeme These auf: So beeindruckend heutige KI-Systeme auch wirken – wissenschaftlich stehen wir seiner Ansicht nach noch am Anfang.
Sprachmodelle seien vor allem mit menschlichen Daten gefüttert und könnten dieses Wissen geschickt wiedergeben, doch sie lernten nicht wirklich weiter und hätten keine eigenen Ziele. Der nächste große Schritt, so Sutton, werde erst kommen, wenn KI-Systeme nicht nur Texte vorhersagen, sondern wie eigenständige Agenten durch Erfahrung lernen, handeln, Rückmeldung bekommen und ihr Verhalten anpassen.
Wir haben uns seinen Vortrag angeschauen, und berichten, worum es geht.
Vorab in eigener Sache: wir überlegen so etwas öfter zu machen, also, aus einem englischsprachigen Vortrag einen deutschsprachigen Artikel zu machen, damit noch mehr Menschen teil haben können. Was meint ihr dazu?
Künstliche Intelligenz macht rasante Fortschritte – so lautet zumindest das gängige Narrativ. Sprachmodelle schreiben Texte, die kaum noch von menschlichen zu unterscheiden sind. Bildgeneratoren erzeugen fotorealistische Szenen. Ganze Industrien entstehen rund um riesige Datenmengen und Mustererkennung. Doch der kanadische KI-Pionier Richard Sutton warnt: Wir verwechseln technologische Leistungsfähigkeit mit echter Intelligenz.
Suttons zentrale These: Die heutigen Systeme sind mächtig – aber nur in einem sehr engen Sinn. Sie sind mit nahezu dem gesamten digitalisierten Wissen der Menschheit gefüttert worden. Doch darüber hinaus sind sie „schwache Geister“. Sie verstehen nicht, was sie tun. Sie verfolgen keine eigenen Ziele. Sie lernen nicht weiter, sobald sie einmal trainiert wurden.
Um das zu verstehen, beginnt Sutton bei der Grundfrage: Was ist eigentlich Intelligenz? Der Psychologe William James sprach davon, „konsistente Ziele mit variablen Mitteln“ zu erreichen. KI-Mitbegründer John McCarthy definierte Intelligenz als den „rechnerischen Teil der Fähigkeit, Ziele zu erreichen“. Sutton selbst präzisiert: Intelligenz ist die Fähigkeit, Ziele zu erreichen, indem man sein Verhalten anpasst. Entscheidend ist das Wort „anpassen“. Intelligenz bedeutet Lernen aus Erfahrung.
Genau hier sieht er das Problem der aktuellen KI-Generation. Wir leben im „Zeitalter der menschlichen Daten“. Sprachmodelle werden darauf trainiert, das nächste Wort vorherzusagen, das ein Mensch wahrscheinlich schreiben würde. Bildmodelle lernen menschliche Beschriftungen. Anschließend werden sie von Experten feinjustiert. Ziel ist es, vorhandenes Wissen in Maschinen zu übertragen. Danach sind die Systeme eingefroren.
Sie generieren nichts grundlegend Neues, sondern kombinieren Bekanntes. Sie können nicht überprüfen, ob ihre Aussagen in der Realität zutreffen. Ihnen fehlt die Rückkopplung durch Erfahrung. Ohne Belohnungssignal, ohne echte Interaktion mit einer Umwelt gibt es keinen Maßstab für „richtig“ oder „falsch“.
Sutton setzt dem das Konzept des Verstärkungslernens entgegen. Hier agiert ein System als „Agent“ in einer Umgebung. Es nimmt wahr, handelt und erhält Rückmeldungen in Form von Belohnungen. Durch Versuch und Irrtum passt es sein Verhalten an. So lernen Tiere. So lernte auch AlphaGo – und entwickelte Züge, die selbst Großmeister überraschten.
Für Sutton markiert dies den Übergang in ein neues „Zeitalter der Erfahrung“. Systeme werden nicht länger nur aus statischen Datensätzen gespeist, sondern lernen kontinuierlich durch Interaktion. Erst so könne KI über menschliche Fähigkeiten hinauswachsen, statt sie lediglich zu imitieren.
Doch Sutton denkt weiter. Er warnt vor politischen Reflexen, KI aus Angst zentral kontrollieren zu wollen. Rufe nach Regulierung und Beschränkung ähnelten historischen Mustern von Misstrauen und Machtsicherung. Fortschritt, so seine Überzeugung, entsteht durch Kooperation – nicht durch Abschottung.
Am Ende wird Sutton philosophisch. Er beschreibt vier große Zeitalter des Universums: das Zeitalter der Teilchen, das der Sterne, das der Replikatoren – also des Lebens – und schließlich das Zeitalter des Designs. Menschen seien besondere Replikatoren: Wir reproduzieren uns biologisch, aber wir entwerfen Werkzeuge, Gebäude, Maschinen. Dinge, die erst im Geist existieren und dann in der Welt.
Künstliche Intelligenz sei die logische Fortsetzung dieses Prozesses: Wir entwerfen Systeme, die selbst entwerfen können. „Designer von Designern“. KI ist für Sutton keine fremde Macht, sondern der nächste Schritt in der langen Geschichte menschlicher Selbstverständigung.
Sein Fazit ist klar: Die heutige KI ist noch nicht der große Umbruch. Aber der Übergang zum Lernen aus Erfahrung könnte es sein. Und statt in Furcht zu verharren, sollten wir diesen Schritt mit Neugier und Mut begleiten.


