OpenAI o3: AGI in zicht?

Eind december onthulde OpenAI o3 (o2 slaan we over vanwege o2.co.uk). De gepresenteerde benchmarks duiden op een significante vooruitgang ten opzichte van o1 en de huidige ontwikkelingen in AI.

Deze drie LLM benchmarks springen eruit bij OpenAI o3

  1. De GPQA-test, met meerkeuzevragen die niet te googelen zijn, toont o3’s superieure kennis: 87% correct, tegenover 34% voor wetenschapers buiten hun specialisme en 81% binnen.
  2. Frontier Math, met extreem moeilijke wiskundeproblemen, zag o3 als eerste AI boven de 2% scoren, met 25%.
  3. Ten slotte versloeg o3 op de ARC-AGI-test, een test met prijs van 1 miljoen dollar, zowel eerdere AI’s als het menselijk basisniveau, met een score van 87,5%.
Grafiek met resultaten OpenAI o3 in ARC-AGI-1 Semi-Private Evaluation set
Resultaten ARC-AGI-1 Semi-Private Evaluation set (bron: ARC Prize)

Hoewel er kanttekeningen zijn, suggereren deze resultaten dat AI-barrières sneller vallen dan gedacht.

Superintelligentie

Bron: WaitButWhy

De introductie van modellen die nadenken heeft iets opgeschud in de AI-industrie. Onderzoekers spreken met urgentie over de komst van superintelligente AI-systemen, een vloedgolf van intelligentie. Niet in een verre toekomst, maar zeer binnenkort.

Vaak wordt gesproken over AGI: Artificial General Intelligence. Systemen die, hoewel de definitie vaag is, menselijke experts overtreffen. De beschikbaarheid van deze intelligentie op afroep, zal de samenleving drastisch en in hoog tempo veranderen.

Ik heb Gemini 2.0 een episch sciencefictionscenario laten schetsen en uitspreken over de mogelijke opkomst van AGI in de vorm van GPT-6 van OpenAI. Heb je 30 minuten? Het is niet eens zo slecht!

Geloof jij in AGI en de komst van superintelligentie?