Startseite » Neuer Artificial Intelligence Report: Mensch vs. KI – wer ist besser?

Neuer Artificial Intelligence Report: Mensch vs. KI – wer ist besser?

Vor wenigen Tagen berichteten wir vom neuen Standord-Index, der die Entwicklung der KI-Modelle weltweit beleuchtet. Auch heute geht es um die Entwicklung der künstlichen Intelligenz, allerdings eher der Frage, inwiefern sie unser menschliches Gehirn bereits übertrifft. Auch hierzu gibt es einen neuen Report, der ein erschreckendes Bild zeichnet.

Fakt ist, dass die KI das menschliche Hirn schon jetzt in vielen grundlegenden Fähigkeiten schlagen kann. Worin die KI überlegen ist und wo sie noch ihre Defizite hat, wird im jährlichen und jetzt wieder aktualisierten Artificial Intelligence Report Stanford erläutert.

Wie intelligent wird die KI noch?

Elon Musk ist der Ansicht, dass die künstliche Intelligenz im Jahr 2025 oder ein Jahr später intelligenter als der weltweit intelligenteste Mensch sein wird. Damit nahm der Tesla- und Space-X-Gründer (und Inhaber von X, ehemals Twitter sowie der ehemalige Mitgründer von OpenAI, die ChatGPT entwickeln) Bezug zum Thema Artificial General Intelligence.

Das ist anderen Leuten gegenüber offenbar etwas zu optimistisch, aber auch ihre Prognosen liegen nicht in allzu weiter Ferne. Führende Köpfe der Branche gehen von mindestens 2030 aus.

Ein kometenhafter Aufstieg

Wo sich dagegen alle einig sind, ist der gigantische Aufstieg, den die KI in den letzten Jahren hingelegt hat. Sie ahmt nicht nur menschliches Verhalten nach, sondern generiert auch selbstständig neue Inhalte. In vielen grundlegenden menschlichen Fähigkeiten ist die künstliche Intelligenz daher jetzt schon besser als der Mensch.

Mensch vs. Maschine – wer ist besser?

Dem Report zufolge punkten große KI-Sprachmodelle, die als Large Language Models bezeichnet werden, derzeit vor allem bei folgenden Aufgaben:

  • Bildanalyse
  • Objekterkennung
  • Sprachverständnis
  • Leseverständnis

In diesen Aufgaben übertrifft die KI den Menschen bereits jetzt routinemäßig, heißt es im Report. Nah dran ist die künstliche Intelligenz außerdem im Bereich Benchmark Massive Multitask Language Understanding (kurz MMLU). Letztes Jahr hat Gemini von Google als erste KI den Test bestanden, in dem 57 einzelne Bereiche (unter anderem Medizin, Geschichte, Mathematik oder Physik) abgefragt werden.

In anderen Bereichen wiederum hinkt die KI noch hinterher, wie zum Beispiel hier:

  • höhere Mathematik (auf dem Level von Wettbewerben)
  • visuelles Denken (inklusive logischer Begründungen)
  • Planungsaufgaben

In dem Bericht heißt es, dass die aktuelle KI-Technik noch nicht zuverlässig mit Fakten umgehen kann. Sie hat außerdem Probleme damit, komplexe Überlegungen anzustellen und ist außerdem nicht so gut darin, Schlussfolgerungen zu erläutern.

Hier noch ein paar prozentuale Werte des Reports, um die Situation zu verdeutlichen. Dabei wird ein aus 2013 stammender menschlicher Vergleichswert auf der 100-Prozent-Linie betrachtet und die KI prozentual gegenübergestellt (und auch ihre jährliche Entwicklung.

Fähigkeiten, die mit dem menschlichen Hirn vergleichbar oder besser sind

Grundlegendes Leseverständnis:

  • 2016: 90,52 Prozent
  • 2017: 97,08 Prozent
  • 2018: menschliche Fähigkeit erreicht

Fortgeschrittenes Leseverständnis:

  • 2017: 82,35 Prozent
  • 2018: 96,23 Prozent
  • 2019: menschliche Fähigkeit erreicht

Verständnis der englischen Sprache:

  • 2019: 94,21 Prozent
  • 2020: 99,44 Prozent
  • 2021: menschliche Fähigkeit erreicht

Multitask Language Understanding:

  • 2019: 36,08 Prozent
  • 2020: 60,02 Prozent
  • 2021: 66,82 Prozent
  • 2022: 83,74 Prozent
  • 2023: menschliche Fähigkeit erreicht

Fähigkeit zu Schlussfolgerungen:

  • 2019: 90,61 Prozent
  • 2020: 96,56 Prozent
  • 2021: 98,89 Prozent
  • 2022: menschliche Fähigkeit erreicht

Klassifizierung von Bildern:

  • 2012: 89,15 Prozent
  • 2013: 91,42 Prozent
  • 2014: 96,94 Prozent
  • 2015: 99,47 Prozent
  • 2016: menschliche Fähigkeit erreicht

Visuelles Denken:

  • 2016: 80,09 Prozent
  • 2017: 86,49 Prozent
  • 2018: 86,70 Prozent
  • 2019: 90,67 Prozent
  • 2020: 91,38 Prozent
  • 2021: menschliche Fähigkeit erreicht

Fähigkeiten, die noch nicht ans menschliche Gehirn reichen

Mathematik auf Wettbewerbslevel:

  • 2021: 7,67 Prozent
  • 2022: 57,56 Prozent
  • 2023: 93,67 Prozent

Begründetes visuelles Denken:

  • 2018: 51,76 Prozent
  • 2019: 78,59 Prozent
  • 2020: 83,29 Prozent
  • 2021: 84,71 Prozent
  • 2022: 88,94 Prozent
  • 2023: 96 Prozent

Wann holt uns die KI komplett ein?

Geht es nach den Herstellern der KI-Modelle, dann sollte es nicht mehr so lange dauern, ehe die Technik uns Menschen eingeholt hat. Die nächste Generation an Sprachmodellen ist in Arbeit, wie unter anderem GPT-5 von OpenAI oder Lllama 3 von Meta. Diese Modelle sollen vor allem in den Bereichen, in denen bis jetzt noch Defizite vorhanden sind, deutlich besser werden, also beispielsweise im logischen Denken, in Planungsaufgaben oder um Konsequenzen abzuschätzen.

Die Entwicklung ist definitiv rasant, wie auch die oberen Prozentwerte in den einzelnen Bereichen zeigen. Spannend ist zudem auch ein neuer Test namens Graduate-Level Google-Proof Q&A Benchmark.

  • Doktoren des jeweiligen Fachgebietes: 65 Prozent der Multiple-Choice-Fragen korrekt
  • Doktoren außerhalb des eigenen Fachgebietes mit Internetnutzung: 35 Prozent der Multiple-Choice-Fragen korrekt
  • KI-Systeme 2023: 30 bis 40 Prozent der Multiple-Choice-Fragen korrekt
  • Chatbot Claude 3 im Jahr 2024: 60 Prozent der Multiple-Choice-Fragen korrekt

Gerade der rasante Fortschritt in der Entwicklung, der dann durch derartige Tests, Reports und Studien abgebildet werden kann, ist immens. Wir dürfen gespannt sein, mit welchen Ergebnissen uns die künstliche Intelligenz im neuen Jahr überraschen wird und ob sie irgendwann selbst Tests entwickelt, um ihre Intelligenz unter Beweis zu stellen.

Quellen: Stanford University, DerStandard, FinancialTimes

 

Written by
Maria Lengemann ist 37, Gamerin aus Leidenschaft, Thriller-Autorin und Serienjunkie. Sie ist seit 14 Jahren selbstständig und journalistisch auf den Hardware- und Gaming-Bereich spezialisiert.

Have your say!

0 0

Antwort schreiben

Your email address will not be published.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Lost Password

Please enter your username or email address. You will receive a link to create a new password via email.

Zur Werkzeugleiste springen