Vor wenigen Tagen berichteten wir vom neuen Standord-Index, der die Entwicklung der KI-Modelle weltweit beleuchtet. Auch heute geht es um die Entwicklung der künstlichen Intelligenz, allerdings eher der Frage, inwiefern sie unser menschliches Gehirn bereits übertrifft. Auch hierzu gibt es einen neuen Report, der ein erschreckendes Bild zeichnet.
Fakt ist, dass die KI das menschliche Hirn schon jetzt in vielen grundlegenden Fähigkeiten schlagen kann. Worin die KI überlegen ist und wo sie noch ihre Defizite hat, wird im jährlichen und jetzt wieder aktualisierten Artificial Intelligence Report Stanford erläutert.
Wie intelligent wird die KI noch?
Elon Musk ist der Ansicht, dass die künstliche Intelligenz im Jahr 2025 oder ein Jahr später intelligenter als der weltweit intelligenteste Mensch sein wird. Damit nahm der Tesla- und Space-X-Gründer (und Inhaber von X, ehemals Twitter sowie der ehemalige Mitgründer von OpenAI, die ChatGPT entwickeln) Bezug zum Thema Artificial General Intelligence.
Das ist anderen Leuten gegenüber offenbar etwas zu optimistisch, aber auch ihre Prognosen liegen nicht in allzu weiter Ferne. Führende Köpfe der Branche gehen von mindestens 2030 aus.
Ein kometenhafter Aufstieg
Wo sich dagegen alle einig sind, ist der gigantische Aufstieg, den die KI in den letzten Jahren hingelegt hat. Sie ahmt nicht nur menschliches Verhalten nach, sondern generiert auch selbstständig neue Inhalte. In vielen grundlegenden menschlichen Fähigkeiten ist die künstliche Intelligenz daher jetzt schon besser als der Mensch.
Mensch vs. Maschine – wer ist besser?
Dem Report zufolge punkten große KI-Sprachmodelle, die als Large Language Models bezeichnet werden, derzeit vor allem bei folgenden Aufgaben:
- Bildanalyse
- Objekterkennung
- Sprachverständnis
- Leseverständnis
In diesen Aufgaben übertrifft die KI den Menschen bereits jetzt routinemäßig, heißt es im Report. Nah dran ist die künstliche Intelligenz außerdem im Bereich Benchmark Massive Multitask Language Understanding (kurz MMLU). Letztes Jahr hat Gemini von Google als erste KI den Test bestanden, in dem 57 einzelne Bereiche (unter anderem Medizin, Geschichte, Mathematik oder Physik) abgefragt werden.
In anderen Bereichen wiederum hinkt die KI noch hinterher, wie zum Beispiel hier:
- höhere Mathematik (auf dem Level von Wettbewerben)
- visuelles Denken (inklusive logischer Begründungen)
- Planungsaufgaben
In dem Bericht heißt es, dass die aktuelle KI-Technik noch nicht zuverlässig mit Fakten umgehen kann. Sie hat außerdem Probleme damit, komplexe Überlegungen anzustellen und ist außerdem nicht so gut darin, Schlussfolgerungen zu erläutern.
Hier noch ein paar prozentuale Werte des Reports, um die Situation zu verdeutlichen. Dabei wird ein aus 2013 stammender menschlicher Vergleichswert auf der 100-Prozent-Linie betrachtet und die KI prozentual gegenübergestellt (und auch ihre jährliche Entwicklung.
Fähigkeiten, die mit dem menschlichen Hirn vergleichbar oder besser sind
Grundlegendes Leseverständnis:
- 2016: 90,52 Prozent
- 2017: 97,08 Prozent
- 2018: menschliche Fähigkeit erreicht
Fortgeschrittenes Leseverständnis:
- 2017: 82,35 Prozent
- 2018: 96,23 Prozent
- 2019: menschliche Fähigkeit erreicht
Verständnis der englischen Sprache:
- 2019: 94,21 Prozent
- 2020: 99,44 Prozent
- 2021: menschliche Fähigkeit erreicht
Multitask Language Understanding:
- 2019: 36,08 Prozent
- 2020: 60,02 Prozent
- 2021: 66,82 Prozent
- 2022: 83,74 Prozent
- 2023: menschliche Fähigkeit erreicht
Fähigkeit zu Schlussfolgerungen:
- 2019: 90,61 Prozent
- 2020: 96,56 Prozent
- 2021: 98,89 Prozent
- 2022: menschliche Fähigkeit erreicht
Klassifizierung von Bildern:
- 2012: 89,15 Prozent
- 2013: 91,42 Prozent
- 2014: 96,94 Prozent
- 2015: 99,47 Prozent
- 2016: menschliche Fähigkeit erreicht
Visuelles Denken:
- 2016: 80,09 Prozent
- 2017: 86,49 Prozent
- 2018: 86,70 Prozent
- 2019: 90,67 Prozent
- 2020: 91,38 Prozent
- 2021: menschliche Fähigkeit erreicht
Fähigkeiten, die noch nicht ans menschliche Gehirn reichen
Mathematik auf Wettbewerbslevel:
- 2021: 7,67 Prozent
- 2022: 57,56 Prozent
- 2023: 93,67 Prozent
Begründetes visuelles Denken:
- 2018: 51,76 Prozent
- 2019: 78,59 Prozent
- 2020: 83,29 Prozent
- 2021: 84,71 Prozent
- 2022: 88,94 Prozent
- 2023: 96 Prozent
Wann holt uns die KI komplett ein?
Geht es nach den Herstellern der KI-Modelle, dann sollte es nicht mehr so lange dauern, ehe die Technik uns Menschen eingeholt hat. Die nächste Generation an Sprachmodellen ist in Arbeit, wie unter anderem GPT-5 von OpenAI oder Lllama 3 von Meta. Diese Modelle sollen vor allem in den Bereichen, in denen bis jetzt noch Defizite vorhanden sind, deutlich besser werden, also beispielsweise im logischen Denken, in Planungsaufgaben oder um Konsequenzen abzuschätzen.
Die Entwicklung ist definitiv rasant, wie auch die oberen Prozentwerte in den einzelnen Bereichen zeigen. Spannend ist zudem auch ein neuer Test namens Graduate-Level Google-Proof Q&A Benchmark.
- Doktoren des jeweiligen Fachgebietes: 65 Prozent der Multiple-Choice-Fragen korrekt
- Doktoren außerhalb des eigenen Fachgebietes mit Internetnutzung: 35 Prozent der Multiple-Choice-Fragen korrekt
- KI-Systeme 2023: 30 bis 40 Prozent der Multiple-Choice-Fragen korrekt
- Chatbot Claude 3 im Jahr 2024: 60 Prozent der Multiple-Choice-Fragen korrekt
Gerade der rasante Fortschritt in der Entwicklung, der dann durch derartige Tests, Reports und Studien abgebildet werden kann, ist immens. Wir dürfen gespannt sein, mit welchen Ergebnissen uns die künstliche Intelligenz im neuen Jahr überraschen wird und ob sie irgendwann selbst Tests entwickelt, um ihre Intelligenz unter Beweis zu stellen.
Quellen: Stanford University, DerStandard, FinancialTimes