보스
코어

오늘 나온 GPT-4.5 요약

등급아이콘 레벨아이콘 유머자료 0 109 03.01 03:00

안구정화 그림

안구정화 그림
 

grok3한테 GPQA, AIME 벤치 10~30% 격차정도로 따임. (심지어 AIME 벤치는 grok3 mini한테 밀리는 모습)

 

 

안구정화 그림

에이전트 코딩 벤치도 sonnet 3.7한테 따이고, 몇달전에 출시된 sonnet 3.6이라고 놀림받는 sonnet 3.5(new) 랑 비비는 모습

 

 

안구정화 그림

안구정화 그림

​arc-agi 벤치 또한 sonnect 3.7과 점수는 거의 동일한데 비해 cost per task(가격 대비) 측면에서 압도적으로 뒤떨어짐

 

 

안구정화 그림

가격은.....10~30배 이상 상승

 

 

1. 기존의 모델 크기(파라미터 수, 층 쌓기)와 컴퓨팅 파워만을 늘리는 스케일 법칙은 더 이상 유효하지 않을 가능성이 굉장히 높다.

 

2. openai는 더 이상 "베이스모델" 에서의 성능 이점을 잡고 있다고 보기 힘들다.


 

물론 여기서 말하는 베이스모델은 test time compute 추론모델을 제외한 것이며, 추론모델은 아직까지 지표상으로는 o3가 가장 높지만.

Comments

번호 제목 글쓴이 날짜 조회
10229 자식이 누나에게 얻어맞다가 죽었는데 기뻐하는 부모님 등급아이콘 레벨아이콘 유머자료 03.01 108
10228 아저씨들 희소식 .jpg 등급아이콘 레벨아이콘 유머자료 03.01 124
10227 토스 만원 이벤트 ㅋㅋㅋㅋ 등급아이콘 레벨아이콘 유머자료 03.01 65
10226 와이프한테 들켜서 변태 소리 들은 남자.JPG 등급아이콘 레벨아이콘 유머자료 03.01 113
10225 자녀의 자위행위 때문에 걱정이신가요? 등급아이콘 레벨아이콘 유머자료 03.01 92
10224 텐아시아 기사 보고 빡친 한가인 인스스 업뎃 등급아이콘 레벨아이콘 유머자료 03.01 113
10223 김앤장 전체가 나서도 불가능한 사건 ㅎㄷㄷ 등급아이콘 레벨아이콘 유머자료 03.01 113
10222 [사회] 교수 실수로 졸업 못 하는데...학교는 "학생 탓".jpg 등급아이콘 레벨아이콘 유머자료 03.01 110
10221 [정보] 대한항공 조종사가 알려주는 비행기 탈 때 꿀팁.jpg 등급아이콘 레벨아이콘 유머자료 03.01 114
10220 신진서, 세계대회 우승 <8관왕 등극> 등급아이콘 레벨아이콘 유머자료 03.01 114
10219 탈모직원에게 막말 논란 등급아이콘 레벨아이콘 유머자료 03.01 73
10218 시그니엘 레지던스 룸서비스 가격 등급아이콘 레벨아이콘 유머자료 03.01 108
10217 치매 걸린 딸을 보는 96세 엄마 등급아이콘 레벨아이콘 유머자료 03.01 114
10216 외국인들이 가장 어려워하는 한국어 등급아이콘 레벨아이콘 유머자료 03.01 76
10215 부통령 밴스 밈 등급아이콘 레벨아이콘 유머자료 03.01 113
10214 감자탕과 뼈해장국 차이 등급아이콘 레벨아이콘 유머자료 03.01 85
10213 젤렌스키-트럼프 회담 후 유럽 각국 정상들 반응 등급아이콘 레벨아이콘 유머자료 03.01 124
10212 트럼트, 젤렌스키 보고 백악관에서 나가라고 통보 등급아이콘 레벨아이콘 유머자료 03.01 116
10211 전국에 약 40명만 있다는 직업 등급아이콘 레벨아이콘 유머자료 03.01 73
10210 [유머] 은행에서 인정하는 전문직 등급아이콘 레벨아이콘 유머자료 03.01 113