OpenAI

GPT-5.4

Name: OpenAI GPT-5.4
Author: OpenAI

비교

Model ID:gpt-5.4-2026-03-05

2026-03-05

비교

GPT-5.4는 2026년 3월에 출시된 OpenAI의 최신 프론티어 모델로, Codex와 GPT 제품군을 단일 시스템으로 통합했습니다. 100만 토큰 이상의 컨텍스트 창, 네이티브 컴퓨터 조작 기능, GPT-5.3-Codex에서 이어받은 최고 수준의 코딩 성능을 갖추고 있습니다. GPT-5.2 대비 토큰 효율이 크게 향상되었으며, 44개 직종에 걸친 지식 업무 벤치마크에서 전문가와 83% 동등 이상의 성과를 기록합니다. 에이전트형 코딩, 문서 이해, 도구 활용, 복잡한 다단계 워크플로에 뛰어납니다.

OpenAI PlusOpenAI ProAPI|비전심층 사고웹 검색파일|상용 모델

학습 완료일

2025-08-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

1.1MIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$2.5IN$15OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenAI GPT-5 Blog LMSYS Chatbot Arena OpenRouter

AI 성능 평가

Arena 종합 점수

1482

±6

집계일 2026-04-20

종합 순위

9위

12,322 투표수

Arena 능력별 점수

한국어 능력

1412±3823위

복잡한 질문

1505±87위

전문 지식

1526±205위

지시 이행

1483±107위

대화 기억

1500±138위

창의력

1450±1414위

코딩 실력

1534±115위

수학 능력

1518±21🥇 1위

Arena 직군별 점수

문학·창작

1470±117위

생활·사회과학

1478±1424위

엔터·미디어

1450±1414위

경영·금융

1480±1310위

의학·보건

1475±2130위

법률·행정

1477±2018위

소프트웨어·IT

1514±98위

수학·통계

1513±23🥉 3위

출처:Arena Intelligence

종합

AA Intelligence Index

57%↑18%

LiveBench

81%↑21%

ForecastBench

58%↓1%

추론·수학

GPQA Diamond

92%↑11%

HLE

42%↑25%

LB 추론

88%↑28%

LB 수학

94%↑21%

LB 데이터 분석

79%↑30%

코딩

AA Coding Index

57%↑23%

LB 코딩

78%↑4%

LB 에이전틱

70%↑27%

TAU2

87%↑14%

TerminalBench

58%↑26%

SciCode

57%↑16%

언어·지시

IFBench

74%↑17%

AA-LCR

74%↑12%

환각률 (HHEM)

7.0%↓3%

사실 일관성 (HHEM)

93%↑3%

LB 언어

83%↑11%

LB 지시

70%↑24%

출력 속도

일반 모드

160tok/s↑78

출력 시작 0.60s

추론 모드

158tok/s↑70

출력 시작 5.40s

출처:Artificial Analysis LiveBench ForecastBench Vectara HHEM

다국어 역량

MGSM 🇰🇷

94%

MGSM 🇯🇵

92%

KMMLU 🇰🇷

77%

JMMLU 🇯🇵

75%

OpenAI