Warum neuronale Netze 30 Jahre als Sackgasse galten

2024 erhielt Geoffrey Hinton den Nobelpreis für Physik – für Arbeiten zu neuronalen Netzen, die er größtenteils in den 1980er Jahren durchgeführt hatte. Zwischen der Forschung und der Auszeichnung lagen vier Jahrzehnte. Für die meisten dieser vierzig Jahre galten neuronale Netze in der Informatik als erledigtes Thema – eine Idee, die ausprobiert und für untauglich befunden worden war.

Wie konnte eine Idee vier Jahrzehnte brauchen, um vom akademischen Abstellgleis zur Grundlage von ChatGPT, Bildgenerierung und medizinischer Diagnostik zu werden? Die Antwort ist eine Geschichte über ein Problem, eine Lösung, die niemand glaubte, und einen Streit der bis heute andauert.

Das Problem: Netze, die nicht lernen konnten

Die Grundidee neuronaler Netze ist alt – lose nachgebildete Schichten von "Neuronen", die Signale gewichten und weiterleiten, ähnlich wie es Nervenzellen im Gehirn tun. Das Problem: Niemand wusste, wie man die Gewichte in mehrschichtigen Netzen systematisch anpassen sollte, damit das Netz aus Fehlern lernt. Ohne diese Methode blieben neuronale Netze auf eine einzige Schicht beschränkt – und damit auf triviale Aufgaben.

1969 veröffentlichten Marvin Minsky und Seymour Papert eine vernichtende Analyse genau dieser Beschränkung. Die Folge: Forschungsgelder versiegten, ein "AI Winter" begann, und neuronale Netze galten in weiten Teilen der Informatik als Sackgasse.

Eine Lösung, die zweimal übersehen wurde

Die Lösung für das Problem – ein Verfahren namens Backpropagation – wurde tatsächlich schon 1970 vom finnischen Mathematiker Seppo Linnainmaa beschrieben, allerdings ohne Bezug zu neuronalen Netzen. 1974 schlug Paul Werbos vor, genau dieses Verfahren für neuronale Netze zu nutzen – veröffentlichte seine Arbeit aber wegen des AI Winters lange nicht.

1986: Der Moment, der alles veränderte – offiziell

Erst 1986 erschien das Paper, das Backpropagation für die Forschungswelt sichtbar machte: "Learning representations by back-propagating errors" von David Rumelhart, Geoffrey Hinton und Ronald Williams, veröffentlicht in Nature. Das Paper zeigte erstmals praxisnah, wie mehrschichtige Netze lernen können – und löste damit das Problem, an dem Minsky und Papert 1969 gescheitert waren.

Hinton selbst hat nie behauptet, Backpropagation erfunden zu haben – er hat das öffentlich klargestellt. Was er und seine Koautoren taten, war etwas anderes, aber nicht weniger Wichtiges: Sie zeigten, dass die Methode tatsächlich funktioniert, und machten sie für eine ganze Forschungsgeneration zugänglich. Genau das ist der Unterschied zwischen einer Erfindung und ihrer Popularisierung – und genau dieser Unterschied ist bis heute Gegenstand einer Debatte in der KI-Forschung.

Der zweite Winter – und ein zweiter, parallel arbeitender Strang

Das Comeback 1986 war kein durchgehender Erfolg. In den 1990er und frühen 2000er Jahren verloren neuronale Netze erneut an Boden – diesmal gegenüber Methoden wie Support Vector Machines, die auf kleineren Datenmengen oft bessere Ergebnisse lieferten. Wieder ein "Winter", wieder Forscher, die weiterarbeiteten, obwohl das Feld ihnen wenig Aufmerksamkeit schenkte.

Einer dieser Forscher war Jürgen Schmidhuber. Gemeinsam mit Sepp Hochreiter veröffentlichte er 1997 das LSTM-Verfahren – Long Short-Term Memory –, das ein zentrales Problem rekurrenter neuronaler Netze löste: die Fähigkeit, sich über lange Zeiträume hinweg an relevante Information zu "erinnern". LSTM wurde später zur dominanten Architektur für Sprachverarbeitung, bevor der Transformer sie ablöste.

Ein Streit, der bis heute andauert

Schmidhuber kritisiert seit Jahren öffentlich, dass die Geschichte der neuronalen Netze zu sehr auf einzelne Namen verkürzt wird – auf Kosten von Forschern wie Linnainmaa, Werbos, Hochreiter und ihm selbst. Nach Hintons Nobelpreis 2024 äußerte er sich Ende 2025 in einem Interview erneut sehr kritisch zur Preisvergabe. Unabhängig davon, wie man zu dieser Auseinandersetzung steht, zeigt sie etwas Wichtiges: Die Geschichte der neuronalen Netze hat nicht einen Vater, sondern mehrere – und einige davon haben jahrzehntelang im Hintergrund gearbeitet, ohne die Anerkennung zu bekommen, die ihre Arbeit später rechtfertigte.

Zeitleiste: Die Anfänge 1940er-1980er (McCulloch & Pitts, Perceptron, Backpropagation), der AI Winter in den 1990ern, die Wende 2000er-2010er (Deep Belief Networks, GPUs, AlexNet) und die Renaissance ab den 2020ern (Transformer, GPT-3, ChatGPT) – mit dem Fazit: nicht die Idee war falsch, die Zeit war falsch — Die lange Umleitung. Das große Comeback.

2012: Der Durchbruch, der den Winter beendete

Der entscheidende Wendepunkt kam 2012, als ein neuronales Netz namens AlexNet – entwickelt von Alex Krizhevsky unter Hintons Anleitung – einen Bilderkennungswettbewerb mit einem Vorsprung gewann, der alles bisher Dagewesene in den Schatten stellte. Was 1986 theoretisch funktionierte, brauchte 2012 zwei zusätzliche Zutaten: genug Daten und genug Rechenleistung, insbesondere durch Grafikkarten, die ursprünglich für Computerspiele entwickelt worden waren.

Ab diesem Moment ging es schnell: Bilderkennung, dann Sprachverarbeitung, dann – mit dem Transformer-Paper von 2017 – die Grundlage für die heutigen großen Sprachmodelle.

Die eigentliche Lehre

Die Geschichte der neuronalen Netze ist keine Geschichte eines einzelnen genialen Moments. Es ist eine Geschichte von Ideen, die zur falschen Zeit auftauchten, von Forschern die weiterarbeiteten obwohl niemand zuhörte, und von einem Streit darüber, wem welche Anerkennung gebührt – ein Streit, der bis in die Gegenwart reicht. Vielleicht ist gerade das die "stille Revolution": nicht der Moment des Durchbruchs, sondern die jahrzehntelange Geduld, die ihm vorausging.