카지노본가-카지노분석,카지노커뮤니티,슬롯분석,꽁머니,카지노커뮤,토토커뮤니티,토토커뮤니티

소닉
크크벳

오늘 나온 GPT-4.5 요약

등급아이콘 레벨아이콘 유머자료 0 95 03.01 03:00

안구정화 그림

안구정화 그림
 

grok3한테 GPQA, AIME 벤치 10~30% 격차정도로 따임. (심지어 AIME 벤치는 grok3 mini한테 밀리는 모습)

 

 

안구정화 그림

에이전트 코딩 벤치도 sonnet 3.7한테 따이고, 몇달전에 출시된 sonnet 3.6이라고 놀림받는 sonnet 3.5(new) 랑 비비는 모습

 

 

안구정화 그림

안구정화 그림

​arc-agi 벤치 또한 sonnect 3.7과 점수는 거의 동일한데 비해 cost per task(가격 대비) 측면에서 압도적으로 뒤떨어짐

 

 

안구정화 그림

가격은.....10~30배 이상 상승

 

 

1. 기존의 모델 크기(파라미터 수, 층 쌓기)와 컴퓨팅 파워만을 늘리는 스케일 법칙은 더 이상 유효하지 않을 가능성이 굉장히 높다.

 

2. openai는 더 이상 "베이스모델" 에서의 성능 이점을 잡고 있다고 보기 힘들다.


 

물론 여기서 말하는 베이스모델은 test time compute 추론모델을 제외한 것이며, 추론모델은 아직까지 지표상으로는 o3가 가장 높지만.

Comments

번호 제목 글쓴이 날짜 조회
10264 중증외상센터 의사가 <넷플릭스 중증외상센터> 보고 부러웠던 점..jpg 등급아이콘 레벨아이콘 유머자료 03.02 89
10263 와이프 인증 레전드.jpg 등급아이콘 레벨아이콘 유머자료 03.02 105
10262 오늘 신촌에 나타났다는 토르.jpg 등급아이콘 레벨아이콘 유머자료 03.02 107
10261 혐)어제 출시한 충격적인 야겜 등급아이콘 레벨아이콘 유머자료 03.02 108
10260 박세리 인스타그램.jpg 등급아이콘 레벨아이콘 유머자료 03.02 104
10259 [유머] 손금 좀 봐줘요~ 올해 저 나쁜남자 만나나요? 등급아이콘 레벨아이콘 유머자료 03.02 104
10258 복싱팬인 트럼프를 위해 젤렌스키가 준비 해 갔던 선물 등급아이콘 레벨아이콘 유머자료 03.02 104
10257 달라도 너무 다른 웹툰작가 부부ㅋㅋㅋㅋㅋㅋ 등급아이콘 레벨아이콘 유머자료 03.02 107
10256 서울 아파트 매물수 근황 ㄷㄷ.jpg 등급아이콘 레벨아이콘 유머자료 03.02 91
10255 미세먼지 줄이려고 나무심었던 중국 근황 등급아이콘 레벨아이콘 유머자료 03.02 105
10254 장난감 산 만화.manhwa 등급아이콘 레벨아이콘 유머자료 03.02 105
10253 이젠 인간을 농락하는 경지에 이르른 AI.jpg 등급아이콘 레벨아이콘 유머자료 03.02 68
10252 [음식] 싫어하는 사람에겐 고수급인 채소 등급아이콘 레벨아이콘 유머자료 03.02 105
10251 예비 부부 현타 등급아이콘 레벨아이콘 유머자료 03.02 74
10250 요즘 망해간다는 헬스장 사업.jpg 등급아이콘 레벨아이콘 유머자료 03.01 105
10249 네이처 "과학 분야, 2위부터 9위는 중국 기관" 등급아이콘 레벨아이콘 유머자료 03.01 83
10248 물이 깨끗한 나라 순위 등급아이콘 레벨아이콘 유머자료 03.01 128
10247 한국인이 왔다니까 칼 들고 뛰쳐나오는 일본인 순사 등급아이콘 레벨아이콘 유머자료 03.01 107
10246 남자친구가 계속 갑질해서 힘들어ㅠ 등급아이콘 레벨아이콘 유머자료 03.01 104
10245 졸지에 유통업자 될 뻔ㅋ 등급아이콘 레벨아이콘 유머자료 03.01 107