Az OpenAI bemutatta a GPT-5.4 architektúrát, amely a natív ágens-képességeket, a dinamikus Tool Search-öt és a professzionális benchmark-dominanciát helyezi előtérbe.
Az OpenAI legújabb modellfrissítése, a GPT-5.4 nem csupán egy inkrementális verzióugrás, hanem egy határozott elmozdulás az autonóm ágensek és a komplex, többlépcsős mérnöki munkafolyamatok támogatása felé. A GPT-5.4 architektúra két fő pillérre, a Thinking (következtetési) és a Pro (teljesítmény-optimalizált) variánsokra oszlik, miközben alapjaiban írja át az API-szintű eszközhasználat és a kontextuskezelés szabályait.

Architektúra és kontextuskezelés: Az 1 millió tokenes korlát
A fejlesztők számára a legfontosabb technikai előrelépés a kontextusablak (context window) kiterjesztése. A GPT-5.4 API-szinten immár hivatalosan is támogatja az 1 millió tokenes ablakot, kilépve a béta fázisból. Ez lehetővé teszi teljes kódbázisok, kiterjedt dokumentációk vagy masszív adatkészletek egyetlen promptba történő betöltését.
Érdemes azonban figyelni a költségoptimalizálásra: a Codex implementációban a 272 000 token feletti kérések 2x-es szorzóval számítódnak bele a használati limitekbe. A modell hatékonyságát növeli az új Tool Search mechanizmus is. Korábban az összes elérhető eszköz (tool) definícióját a system promptban kellett rögzíteni, ami jelentős token-overheadet generált. Az új rendszerben a modell dinamikusan, igény szerint keresi ki a szükséges eszközdefiníciókat, ami redukálja a latency-t és a költségeket komplex ökoszisztémákban.
Natív számítógép-vezérlés (Computer Use)
A GPT-5.4 az OpenAI első olyan modellje, amelyet natív számítógép-használati képességekkel vérteztek fel. Ez nem csupán API-hívásokat jelent, hanem a grafikus felület (GUI) közvetlen manipulációját:
- Screenshot-alapú navigáció: A modell képes értelmezni a képernyőképeket és azok alapján egér- és billentyűparancsokat generálni.
- Cross-app munkafolyamatok: Képes párhuzamosan több alkalmazásban (pl. Excel, böngésző, IDE) feladatokat végrehajtani.
- Agentic viselkedés: A modell nemcsak válaszol, hanem végrehajt, például képes önállóan adatokat gyűjteni a webről, majd azokat egy pénzügyi modellbe integrálni.
Benchmarkok és mérnöki validáció
A GPT-5.4 Pro változatát kifejezetten a legnehezebb matematikai és szakmai feladatokra optimalizálták. A FrontierMath benchmarkon, amely a legmagasabb szintű matematikai problémákat tartalmazza, a Pro változat 38%-os eredményt ért el, szemben a Thinking verzió 27,1%-ával.
| Benchmark | GPT-5.4 Pro | GPT-5.4 Thinking | GPT-5.2 | Anthropic Opus 4.6 |
|---|---|---|---|---|
| GDPval (Szakmai feladatok) | 83.0% | 81.5% | 76.2% | 79.5% |
| FrontierMath | 38.0% | 27.1% | 19.4% | 22.0% |
| SWE-Bench Pro (Coding) | 52.4% | 49.8% | 41.2% | 45.5% |
| Factual Accuracy (Error rate reduction) | -33% | -33% | Base | - |
Az adatok alapján a GPT-5.4 18%-kal kevesebb hibát vét összesítve, az egyedi állítások szintjén pedig 33%-kal csökkent a hallucinációk esélye a GPT-5.2-höz képest.
A “Thinking” folyamat transzparenciája
A GPT-5.4 Thinking egyik legizgalmasabb újítása a mid-response steering. A modell a válaszadás megkezdése előtt egy előzetes tervet (upfront plan) vázol fel a gondolatmenetéről (Chain-of-Thought - CoT). A felhasználó ezen a ponton beavatkozhat, és módosíthatja az irányt, mielőtt a modell több ezer tokent pazarolna el egy rossz megközelítésre.
{
"action": "thinking_process",
"plan": [
"1. Parse spreadsheet data from source_v1.csv",
"2. Identify outliers using Z-score analysis",
"3. Generate visualization using Matplotlib",
"4. Synthesize executive summary"
],
"status": "awaiting_user_validation"
}
Biztonsági szempontból kritikus, hogy az OpenAI új CoT-monitorozási rendszert vezetett be. Ez figyeli, hogy a modell belső monológja és a tényleges kimenete összhangban van-e, minimalizálva a “megtévesztő érvelés” (deceptive reasoning) kockázatát.
Tokenomics: Drágább, de hatékonyabb?
Az árazás jelentősen emelkedett, ami a Pro modell esetében különösen szembetűnő. Az OpenAI érvelése szerint azonban a megnövelt token-hatékonyság miatt a komplex feladatok összköltsége nem feltétlenül nő arányosan.
- GPT-5.4 Thinking: $2.50 / $15.00 (Input/Output per 1M token)
- GPT-5.4 Pro: $30.00 / $180.00 (Input/Output per 1M token)

Konklúzió mérnöki szemmel
A GPT-5.4 nem a hobbifelhasználóknak készült. A Pro változat árazása és a Thinking modell iteratív jellege egyértelműen az enterprise szektort, a pénzügyi elemzőket és a szoftvermérnököket célozza. A natív számítógép-vezérlés és a Tool Search bevezetése azt jelzi, hogy az OpenAI már nem csak egy chatbotot, hanem egy operációs rendszer szintű ágenst épít. Ipari környezetben a 33%-os faktualitás-javulás és a CoT-transzparencia elegendő indok lehet a váltásra, még a magasabb token-költségek mellett is.