『Humanitys Last Exam - Die letzte Prüfung der Menschheit?』のカバーアート

Humanitys Last Exam - Die letzte Prüfung der Menschheit?

Humanitys Last Exam - Die letzte Prüfung der Menschheit?

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

Stell dir vor, die beste KI der Welt schreibt die schwerste Prüfung aller Zeiten – und besteht sie zu 50%. Klingt nach Science-Fiction? Ist es aber nicht! In dieser Podcast-Folge tauchen wir ein in die spannende Welt von „Humanity’s Last Exam“ (HLE), https://agi.safe.ai dem ultimativen Test für künstliche Intelligenz. 2.500 extrem schwierige Fragen aus über 100 Fächern – von Quantenphysik bis zu alten Sprachen – zeigen, wie nah oder fern KI-Systeme wirklich an menschlicher Intelligenz sind.

Wer führt aktuell das Rennen an? Google Gemini 3 erreicht 41% und ist damit Spitzenreiter unter den multimodalen Modellen, die nicht nur Texte, sondern auch Bilder, Videos und Audio verstehen. Doch die Konkurrenz schläft nicht: Grok 4 Heavy von Elon Musks xAI schafft beeindruckende 50,7% – allerdings mit Hilfsmitteln und rein textbasiert. Das chinesische Open-Source-Modell Kimi K2 Thinking liegt mit 44,9% knapp dahinter und übertrifft sogar Googles ältere Versionen. Doch das eigentliche Highlight kommt aus der Schweiz: Giotto.ai, ein Startup aus Lausanne, das mit einem winzigen Modell von nur 200 Millionen Parametern beim ARC-AGI-Test für abstraktes Denken führt. Während die Grossen mit Milliarden Parametern um die Wette rüsten, zeigt Giotto, dass Effizienz und Ethik vielleicht der Schlüssel zum Erfolg sind.

Warum ist das alles relevant für dich? Weil HLE nicht nur ein Test ist, sondern ein Weckruf: Wenn KIs bald die Hälfte der Fragen richtig beantworten, die selbst Experten herausfordern, was bleibt dann noch für uns Menschen? Diese Folge erklärt dir, warum Benchmarks wie HLE entscheidend sind, um zu verstehen, wo KI heute steht – und wohin sie sich entwickelt. Wir sprechen über die Risiken von „halluzinierenden“ KIs, die selbstbewusst falsche Antworten geben, und warum Tests wie HLE helfen, echte Intelligenz von bloßer Datenwiederholung zu unterscheiden.

Am Ende bleibt die grosse Frage: Können wir KI vertrauen, wenn sie 50% besteht? Und was kommt als Nächstes – eine noch härtere Prüfung oder die Zusammenarbeit zwischen Mensch und Maschine?


Bei Fragen: ⁠#fragRoger⁠⁠: ⁠⁠⁠⁠http://roger.social/⁠⁠⁠⁠⁠

Abonnier auch meinen ⁠Newsletter⁠: http://www.fragroger.social/

Oder schau bei uns in der KI Community: ⁠⁠⁠⁠⁠https://www.ki-update.com ⁠⁠⁠⁠

Und wenn Du mehr ⁠KI anwenden willst, melde dich gerne bei mir: ⁠⁠⁠⁠⁠https://top-speakers.ch/roger-l-basler-de-roca/⁠⁠⁠⁠


Wer bin ich?
Roger Basler de Roca | MSc Digital Business | PhD Candidate

Als Digital-Unternehmer, Buchautor und Top-100-Speaker bin ich seit über 25 Jahren in digitalen Welten zu Hause – mit einer besonderen Leidenschaft für Künstliche Intelligenz, Algorithmen und die Souveränität des Menschen im digitalen Zeitalter.

Ich spreche die Sprache der Algorithmen, auch wenn Pflanzen bei mir weniger gut gedeihen. Mein Ziel: Menschen und Organisationen befähigen, Digitalisierung und KI nicht nur zu nutzen, sondern selbstbestimmt zu gestalten.

Mein Schwerpunkt liegt auf dem Aufbau digitaler Geschäfts- und Wachstumsmodelle durch Educational Consulting – der Schnittstelle von Bildung, Technologie und unternehmerischem Denken.

まだレビューはありません