카지노본가-카지노분석,카지노커뮤니티,슬롯분석,꽁머니,카지노커뮤,토토커뮤니티,토토커뮤니티

업
크크벳

오늘 나온 GPT-4.5 요약

등급아이콘 레벨아이콘 유머자료 0 99 03.01 03:00

안구정화 그림

안구정화 그림
 

grok3한테 GPQA, AIME 벤치 10~30% 격차정도로 따임. (심지어 AIME 벤치는 grok3 mini한테 밀리는 모습)

 

 

안구정화 그림

에이전트 코딩 벤치도 sonnet 3.7한테 따이고, 몇달전에 출시된 sonnet 3.6이라고 놀림받는 sonnet 3.5(new) 랑 비비는 모습

 

 

안구정화 그림

안구정화 그림

​arc-agi 벤치 또한 sonnect 3.7과 점수는 거의 동일한데 비해 cost per task(가격 대비) 측면에서 압도적으로 뒤떨어짐

 

 

안구정화 그림

가격은.....10~30배 이상 상승

 

 

1. 기존의 모델 크기(파라미터 수, 층 쌓기)와 컴퓨팅 파워만을 늘리는 스케일 법칙은 더 이상 유효하지 않을 가능성이 굉장히 높다.

 

2. openai는 더 이상 "베이스모델" 에서의 성능 이점을 잡고 있다고 보기 힘들다.


 

물론 여기서 말하는 베이스모델은 test time compute 추론모델을 제외한 것이며, 추론모델은 아직까지 지표상으로는 o3가 가장 높지만.

Comments

번호 제목 글쓴이 날짜 조회
10257 달라도 너무 다른 웹툰작가 부부ㅋㅋㅋㅋㅋㅋ 등급아이콘 레벨아이콘 유머자료 03.02 108
10256 서울 아파트 매물수 근황 ㄷㄷ.jpg 등급아이콘 레벨아이콘 유머자료 03.02 91
10255 미세먼지 줄이려고 나무심었던 중국 근황 등급아이콘 레벨아이콘 유머자료 03.02 105
10254 장난감 산 만화.manhwa 등급아이콘 레벨아이콘 유머자료 03.02 105
10253 이젠 인간을 농락하는 경지에 이르른 AI.jpg 등급아이콘 레벨아이콘 유머자료 03.02 68
10252 [음식] 싫어하는 사람에겐 고수급인 채소 등급아이콘 레벨아이콘 유머자료 03.02 106
10251 예비 부부 현타 등급아이콘 레벨아이콘 유머자료 03.02 75
10250 요즘 망해간다는 헬스장 사업.jpg 등급아이콘 레벨아이콘 유머자료 03.01 106
10249 네이처 "과학 분야, 2위부터 9위는 중국 기관" 등급아이콘 레벨아이콘 유머자료 03.01 84
10248 물이 깨끗한 나라 순위 등급아이콘 레벨아이콘 유머자료 03.01 129
10247 한국인이 왔다니까 칼 들고 뛰쳐나오는 일본인 순사 등급아이콘 레벨아이콘 유머자료 03.01 108
10246 남자친구가 계속 갑질해서 힘들어ㅠ 등급아이콘 레벨아이콘 유머자료 03.01 105
10245 졸지에 유통업자 될 뻔ㅋ 등급아이콘 레벨아이콘 유머자료 03.01 108
10244 의외로 본명 등급아이콘 레벨아이콘 유머자료 03.01 116
10243 뭐만 거슬리면 부들 부들 등급아이콘 레벨아이콘 유머자료 03.01 109
10242 네이버지도 거리뷰 이스터에그 등급아이콘 레벨아이콘 유머자료 03.01 106
10241 ? : 3.1절을 하루만 쉬면 의미가 퇴색된다. 등급아이콘 레벨아이콘 유머자료 03.01 106
10240 권상우가 한동안 간, 천엽을 안먹은 이유 등급아이콘 레벨아이콘 유머자료 03.01 114
10239 "아니, 뭔 무공 익히는게 그리 복잡해요? 쉬운거 없어요?" 등급아이콘 레벨아이콘 유머자료 03.01 108
10238 한국 전역증으로 미국에서 할인 받을 때 조심해야하는 이유 등급아이콘 레벨아이콘 유머자료 03.01 60