오픈AI, 새 AI 모델 'o3' 내년 출시…"AGI에 한층 더 가까워져"
2024-12-21 11:55:41 원문 2024-12-21 11:46 조회수 909
게시글 주소: https://iu.orbi.kr/00070733744
[서울=뉴시스]윤정민 기자 = 오픈AI가 자사 인공지능(AI) 모델 'o1'보다 추론 능력이 더 향상된 'o3'를 내년에 출시한다.
오픈AI는 20일(현지시각) '오픈AI의 12일(12 Days of OpenAI)' 12일 차 행사에서 새 AI 모델 'o3'와 소형 모델 'o3 미니'를 소개했다.
o3는 오픈AI가 지난 9월 출시한 'o1'보다 추론 성능에서 향상된 버전이다. o1과 마찬가지로 이용자 질문에 답하기 전에 답을 추론하도록 설계됐다. 수학, 과학, 코딩 등 부문에서 성능이 한층 더 강화됐다.
오픈AI에 따르면...
-
서울의대 교수 "수험생, 공부는 또 하면 돼…내년 증원 철회해야"
09/11 14:02 등록 | 원문 2024-09-11 12:26 3 6
서울대 의대 비대위원장을 지냈던 방재승 서울대 의대 교수가 2025학년도 증원...
-
정부, '플랫폼법' 제정 포기…공정거래법으로 '독과점' 규제
09/11 14:00 등록 | 원문 2024-09-10 05:35 0 1
정부가 새로운 법안 제정이 아닌 '독점 규제 및 공정거래에 관한 법률'(이하...
-
서울의대 교수 "수험생, 공부는 또 하면 돼…내년 증원 철회해야"
09/11 12:43 등록 | 원문 2024-09-11 12:26 43 111
서울대 의대 비대위원장을 지냈던 방재승 서울대 의대 교수가 2025학년도 증원...
-
올해 수능 N수생 18만여명, 21년만에 최대..'사탐런' 현상도 현실화
09/11 12:35 등록 | 원문 2024-09-11 12:00 4 1
올해 대학수학능력시험(수능)을 보는 'N수생(졸업생+검정고시 출신)' 수가...
-
서울교육감 후보 선호도, 진보성향 34.4% vs 보수성향 24.2%
09/11 09:42 등록 | 원문 2024-09-11 06:01 4 10
서울시교육감 보궐선거가 다음 달 16일 치러지는 가운데, 교육감 성향 선호도에...
-
[백브RE핑] 국정감사에 챗GPT 활용하겠다는 국민의힘…이준석 "위험한 발상, 겉멋 남발"
09/11 00:51 등록 | 원문 2024-09-10 22:42 4 2
국민의힘이 오는 국정감사에서 챗GPT를 활용하겠다며 소속 의원들에게 유료 계정을...
-
[단독] 국민의힘, 챗GPT로 국감 대비… "AI로 정당 문화 바꾼다"
09/11 00:49 등록 | 원문 2024-09-08 15:01 1 1
국민의힘이 다음 달 7일부터 시작되는 22대 국회 첫 국정감사를 앞두고 소속 의원...
-
서울대 '1000원 학식' 모금 1주년…기부금 7억 기록
09/10 22:42 등록 | 원문 2024-09-10 18:03 0 7
[서울=뉴시스] 오정우 기자 = 서울대학교가 재학생을 대상으로 한 '1000원의...
-
경찰, '여성판 N번방' 사건 게시자 7명 특정…관할서 이송
09/10 20:42 등록 | 원문 2024-09-09 18:41 7 4
여성 전용 커뮤니티에 남성들의 나체 사진 등을 게재해 유포한 사건과 관련해 경찰이...
-
대통령실 “2025년 의대 정원, 언급 가능해도 조정은 불가”
09/10 20:24 등록 | 원문 2024-09-10 19:11 9 12
[앵커] 하지만 의정갈등, 주체는 떠난 전공의와 정부, 대통령실이죠. 대통령실은...
오픈AI의 12일(12 Days of OpenAI)' 12일 차 행사에서 새 AI 모델 'o3'와 소형 모델 'o3 미니'를 소개했다.
오픈AI 측은 o3가 특정 조건에서 범용인공지능(AGI)에 가까워졌다고 설명했다.
코딩 기술을 측정하는 지표(Codeforces)에서는 2727점을 기록했다. 엔지니어 상위 99.2%에 해당하는 2400점보다 높은 점수를 기록한 것이다.
미국 수학 경시대회 중 하나인 AIME의 경우 올해 대회에 출제된 문제 중 한 문제만 틀렸다.
대학원 수준의 생물학, 물리학, 화학 문제 시험(GPQA Diamond)에서는 정답률 87.7%를 달성했다.
에포크AI의 프론티어매스 벤치마크에서도 문제의 25.2%를 풀어내는 데 성공했다. 다른 모델은 2%를 넘지 못했었다.
아기에 한층 더 가까워짐?