카지노본가-카지노분석,카지노커뮤니티,슬롯분석,꽁머니,카지노커뮤,토토커뮤니티,토토커뮤니티

히어로
볼트

오늘 나온 GPT-4.5 요약

등급아이콘 레벨아이콘 유머자료 0 92 03.01 03:00

안구정화 그림

안구정화 그림
 

grok3한테 GPQA, AIME 벤치 10~30% 격차정도로 따임. (심지어 AIME 벤치는 grok3 mini한테 밀리는 모습)

 

 

안구정화 그림

에이전트 코딩 벤치도 sonnet 3.7한테 따이고, 몇달전에 출시된 sonnet 3.6이라고 놀림받는 sonnet 3.5(new) 랑 비비는 모습

 

 

안구정화 그림

안구정화 그림

​arc-agi 벤치 또한 sonnect 3.7과 점수는 거의 동일한데 비해 cost per task(가격 대비) 측면에서 압도적으로 뒤떨어짐

 

 

안구정화 그림

가격은.....10~30배 이상 상승

 

 

1. 기존의 모델 크기(파라미터 수, 층 쌓기)와 컴퓨팅 파워만을 늘리는 스케일 법칙은 더 이상 유효하지 않을 가능성이 굉장히 높다.

 

2. openai는 더 이상 "베이스모델" 에서의 성능 이점을 잡고 있다고 보기 힘들다.


 

물론 여기서 말하는 베이스모델은 test time compute 추론모델을 제외한 것이며, 추론모델은 아직까지 지표상으로는 o3가 가장 높지만.

Comments

번호 제목 글쓴이 날짜 조회
10269 난임병원에 애 데려오지 마세요 등급아이콘 레벨아이콘 유머자료 03.02 102
10268 사투리를 전혀 안 쓴다는 에어부산 승무원들  등급아이콘 레벨아이콘 유머자료 03.02 102
10267 은행원 정년퇴직 후 현실 등급아이콘 레벨아이콘 유머자료 03.02 102
10266 카톡방 실수 대참사 등급아이콘 레벨아이콘 유머자료 03.02 83
10265 배정남 인스타 등급아이콘 레벨아이콘 유머자료 03.02 114
10264 중증외상센터 의사가 <넷플릭스 중증외상센터> 보고 부러웠던 점..jpg 등급아이콘 레벨아이콘 유머자료 03.02 88
10263 와이프 인증 레전드.jpg 등급아이콘 레벨아이콘 유머자료 03.02 102
10262 오늘 신촌에 나타났다는 토르.jpg 등급아이콘 레벨아이콘 유머자료 03.02 105
10261 혐)어제 출시한 충격적인 야겜 등급아이콘 레벨아이콘 유머자료 03.02 102
10260 박세리 인스타그램.jpg 등급아이콘 레벨아이콘 유머자료 03.02 102
10259 [유머] 손금 좀 봐줘요~ 올해 저 나쁜남자 만나나요? 등급아이콘 레벨아이콘 유머자료 03.02 102
10258 복싱팬인 트럼프를 위해 젤렌스키가 준비 해 갔던 선물 등급아이콘 레벨아이콘 유머자료 03.02 102
10257 달라도 너무 다른 웹툰작가 부부ㅋㅋㅋㅋㅋㅋ 등급아이콘 레벨아이콘 유머자료 03.02 105
10256 서울 아파트 매물수 근황 ㄷㄷ.jpg 등급아이콘 레벨아이콘 유머자료 03.02 88
10255 미세먼지 줄이려고 나무심었던 중국 근황 등급아이콘 레벨아이콘 유머자료 03.02 102
10254 장난감 산 만화.manhwa 등급아이콘 레벨아이콘 유머자료 03.02 102
10253 이젠 인간을 농락하는 경지에 이르른 AI.jpg 등급아이콘 레벨아이콘 유머자료 03.02 67
10252 [음식] 싫어하는 사람에겐 고수급인 채소 등급아이콘 레벨아이콘 유머자료 03.02 103
10251 예비 부부 현타 등급아이콘 레벨아이콘 유머자료 03.02 71
10250 요즘 망해간다는 헬스장 사업.jpg 등급아이콘 레벨아이콘 유머자료 03.01 102