한국일보 애틀랜타
첫광고
이규 레스토랑
김성희 부동산

현실로 나타난 ‘그녀’(영화‘Her’)···사람처럼 보고 듣고 말한다

미국뉴스 | | 2024-05-15 09:22:58

범용, AGI, 상용화,엄니모델,인공지능

권순상 노흥성 부동산 470-218-6136표정원 융자미국 크래딧 교정

■범용 AGI 상용화 성큼

옴니모델 AI 0.232초만에 응답

농담 섞인 대화에 다양한 말투

노래 부르고 실시간 번역 가능

기존보다 성능 2배·절반 비용

올트먼“모든 이용자 무료제공

미라 무라티 오픈AI 최고기술책임자(CTO)가 13일 생중계를 통해 GPT-4o를 공개하고 있다. <오픈AI 유튜브>
미라 무라티 오픈AI 최고기술책임자(CTO)가 13일 생중계를 통해 GPT-4o를 공개하고 있다. <오픈AI 유튜브>

 

 

 

null

 

 

 

챗GPT 개발사인 오픈AI가 사람처럼 보고 듣고 말하는 ‘옴니모델’ 인공지능(AI)‘GPT-4o’를 13일 전격 공개했다. GPT-4o는 기존‘GPT-4 터보’보다 성능이 개선됐으며 50% 저렴한 비용으로 구동 가능해 효율성도 매우 높다. 구글의 연례 개발자회의(I/O)를 하루 앞두고 오픈AI·마이크로소프트(MS) 진영이 한층 업그레이드된 버전을 선보이며 초거대 AI 시장 패권 경쟁이 한층 달아오르는 양상이다.

오픈AI는 이날 온라인 신제품 발표 행사를 통해 최신 대규모언어모델(LLM) ‘GPT-4o’를 공개했다. GPT-4o의 ‘o’는 모든 것이라는 ‘옴니(omni)’를 의미한다. 언어 외 사진·음성 등을 함께 처리할 수 있는 멀티모달을 넘어섰다는 의미다.

이날 공개된 GPT-4o는 질문과 답변이 한 번씩 오가던 기존 음성 챗봇과 달리 농담 섞인 자연스러운 대화가 가능할 뿐 아니라 말투 또한 다양하다. 대답 중에 끼어들어도 대화를 계속 이어가는 능력을 갖추고 있어 인간을 뛰어넘는 범용인공지능(AGI) 개발에 한발 더 다가섰다는 평가도 나온다. 이날 오픈AI가 시연한 GPT-4o는 로봇처럼 건조한 톤은 물론 뮤지컬 배우처럼 노래하듯 말하는 모습까지 보여줬다. GPT-4o 간 대화도 가능할 뿐 아니라 노래를 주고받기도 한다. 실시간 통·번역도 가능하다. 이탈리아어를 GPT-4o가 영어로 번역해 말해주고, 영어로 대답하면 이를 다시 이탈리아어로 번역해 말하는 식이다.

비전 인식도 더욱 개선됐다. 카메라를 통해 ‘시야’를 인식해 공간의 분위기나 사람의 기분을 이해함은 물론 수식을 실시간으로 해석해 선생님처럼 풀이 과정을 안내해주기도 한다. 이날 오픈AI는 간단한 수식 풀이 과정을 GPT-4o가 도와주는 모습을 시연했다. ‘3x+1=4’라는 수식을 보여주면 “x를 구하기 위해서는 1을 한곳에 모아야 한다”고 답한다. 직접적인 풀이법을 제시하는 데서 끝나지 않고 ‘해법’을 차근차근 알려주는 것이다.

GPT-4o는 AI 비서와 남성이 사랑에 빠지는 2013년 작 영화 ‘그녀(Her)’를 연상케 한다. 샘 올트먼 오픈AI 최고경영자(CEO)는 행사 종료 이후 자신의 X(옛 트위터)에 ‘Her’라는 단어를 올렸다. 그러면서 “(새 AI 모델이) 영화에 나오는 AI처럼 느껴지고, 그것이 현실이라는 게 놀랍다”고 적었다.

GPT-4o는 기존 GPT-4 터보보다 뛰어난 성능을 자랑한다. 오픈AI는 수학·물리학·법학·윤리학 등 57개 과목을 테스트하는 다중언어작업이해(MMLU)에서 GPT-4o가 88.7%를 기록해 GPT-4 터보의 86.5%와 구글 ‘제미나이 울트라’의 83.7%를 넘어섰다고 밝혔다. 오픈AI는 “GPT-4o는 언어와 추론 및 코딩 지능에서 GPT-4 터보 수준이고 다국어와 오디오·비전에서는 새 최고 기록을 달성했다”고 전했다.

기능은 개선된 반면 AI 구조는 가벼워졌다. 언어별 토큰 사용량이 GPT-4 터보 대비 1.1~4.4배 줄었고, 앱인터페이스(API)는 기존보다 2배 빠르다. 오픈AI는 GPT-4o의 평균 응답 시간이 0.232초에 불과해 인간 평균인 0.32초보다도 빠르다고 밝혔다. 전작인 GPT-3.5와 GPT-4의 평균 응답 시간이 각각 2.8초, 5.4초였다는 점을 고려하면 혁신적인 발전 속도다. 모델 경량화는 비용 절감으로 이어진다. GPT-4o는 작동 비용도 전작 대비 50% 저렴하다는 게 회사 측 설명이다.

오픈AI는 GPT-4o를 모든 사용자에게 무료로 제공할 방침이다. 기존 무료 사용자에게 제공되던 GPT-3.5를 GPT-4o가 대체하게 되는 것이다. 올트먼 CEO는 “오픈AI의 임무는 AI 도구를 사람들의 손에 제공하는 것”이라며 “광고 없이 챗GPT에서 세계 최고 모델을 무료로 사용할 수 있게 돼 자랑스럽다”고 밝혔다. GPT-4o는 이날부터 글로벌 챗GPT 사용자들에게 순차적으로 적용된다. 지원 언어는 한국어를 포함해 50개다.

<서울경제=윤민혁 특파원 >

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

미국내 유학생 ‘체류 자동연장’ 폐지 초읽기
미국내 유학생 ‘체류 자동연장’ 폐지 초읽기

백악관 최종규제안 승인 최대 4년으로 제한 강화 올 가을부터 시행 전망 ‘학업시 계속 체류’ 옛말미국내 유학생‘체류 자동연장’ 폐지 규정 시행이 초읽기에 들어가면서 유학생이 많은

‘피싱 사기’ 급증… 미국인 하루 평균 14건 노출
‘피싱 사기’ 급증… 미국인 하루 평균 14건 노출

진화하는 해킹 범죄악성코드 설치 통해 전파 인공지능(AI)의 발달로 피싱(Phishing) 사기가 갈수록 정교해지면서 미국인들이 하루 평균 14건의 사기성 문자나 이메일을 받고 있

트럼프 “충성하라” vs 대법원 “헌법 우선”
트럼프 “충성하라” vs 대법원 “헌법 우선”

출생시민권 등 판결 임박속대법원 향해 공개적 압박에트럼프·대법원 갈등 고조사법독립·대통령 권한 논란 도널드 트럼프 대통령과 연방 대법원 간의 갈등이 새로운 국면으로 접어들고 있다.

소비자심리 반등… 개솔린 가격 하락에 숨통
소비자심리 반등… 개솔린 가격 하락에 숨통

소비자들의 경제 심리가 개솔린 가격 하락 등에 힘입어 개선됐다. 다만 물가 상승에 대한 우려는 여전한 것으로 나타났다. 미시건대는 경기에 대한 소비자들의 자신감을 반영하는 소비자심

중국산 AI ‘봇물’… 챗GPT 등 더 싸질까
중국산 AI ‘봇물’… 챗GPT 등 더 싸질까

업계 전반 가격전쟁 치열 저렴한 모델과 혼용 사용 오픈AI도 인하 합류 검토 IPO 앞두고 적잖은 부담 저렴한 중국산 인공지능(AI)이 확산하며 AI 업계 전반에 가격 전쟁의 불이

미,‘관세 회피’ 행위 단속 대폭 강화

수출·수입 기업 철저 대비수입신고 검증 제도 확대 원산지·가격신고 사전 점검고액 배상·형사처벌도 가능 도널드 트럼프 행정부가 고율 관세를 피하려는 ‘관세 회피’ 행위에 대한 단속을

앨런 그린스펀 전 연준 의장 별세… 향년 100세
앨런 그린스펀 전 연준 의장 별세… 향년 100세

레이건부터 부시 정부까지20년 가까이 연준 이끌며1990년대 경제 호황 견인  앨런 그린스펀 전 연준 의장. [로이터]  미국 경제와 세계 금융시장에 20년 가까이 막강한 영향력을

LG, 초대형 사이니지 ‘매그니티’ 공개
LG, 초대형 사이니지 ‘매그니티’ 공개

북미 디스플레이 전시회최고 제품상·기술력 입증 ‘인포컴 2026’에 전시된 LG 매그니트 [LG전자 제공]  LG전자는 최근 라스베가스에서 열린 북미 최대 디스플레이 전시회 ‘인포

SNS ‘엑스’ 접속 장애…전 세계 발생 후 복구

일론 머스크의 사회관계망서비스(SNS) 엑스(X·옛 트위터)가 한때 대규모 접속 장애를 겪다 복구됐다. 인터넷 접속 상황을 감시하는 웹사이트 ‘다운디텍터’에 따르면 X는 미 동부시

르세라핌, 스포티파이 월간 청취자 2000만 돌파
르세라핌, 스포티파이 월간 청취자 2000만 돌파

/사진=쏘스뮤직걸그룹 르세라핌(LE SSERAFIM)이 스포티파이의 주요 지표에서 두각을 나타냈다.르세라핌(김채원 사쿠라 허윤진 카즈하 홍은채)은 최근 스포티파이에서 월간 청취자

이상무가 간다 yotube 채널