한국일보 애틀랜타
첫광고
김성희 부동산
이규 레스토랑

최신‘GPT-5’… 기초적 오류 연발‘망신살’

미국뉴스 | | 2025-08-20 09:26:45

최신‘GPT-5’, 기초적 오류 연발

구양숙 부동산표정원 융자미국 크래딧 교정

   오픈AI 야심차게 출시

   틀린 맞춤법·오타 범벅  

“박사급 수준맞아”조롱

 부랴부랴 이전버전 제공

 

‘토네시주, 미시시포주, 웨스트위지나주…’

글자를 갓 배우기 시작한 어린이가 ‘테네시주, 미시시피주, 웨스트버지니아주’의 철자를 잘못 적은 것처럼 보이지만, 실은 세계에서 이용자가 가장 많은 생성형 인공지능(AI)의 최신 모델이 내놓은 답변에 포함된 내용이다.

오픈AI가 야심 차게 내놓은 챗GPT의 최신 모델 ‘GPT-5’가 기대에 크게 못 미치는 성능을 보인 탓에 조롱거리로 전락했다고 CNN 방송이 보도했다.

지난 7일 GPT-5가 처음 공개될 때만 해도 AI 업계와 이용자들은 한껏 기대에 부풀었다.

샘 올트먼 오픈AI 최고경영자(CEO)가 해당 모델이 “박사급 전문가 수준”이라고 내세웠기 때문이다. 이전 모델들인 GPT-3와 GPT-4가 각각 고등학생과 대학생 수준이었던 것과 견줘 크게 진일보했다는 설명이었다. 그는 심지어 GPT-5가 “큰 도약이자 범용인공지능(AGI)를 향한 중요한 진전”이라고도 언급했다.

AGI는 인간과 같거나 그보다 높은 지적 능력을 갖춘 AI를 뜻하는 말로, AI 연구자들의 궁극적 목표이자 숙원이다. 그러나 막상 GPT-5를 실제 접해본 이용자들은 연이어 보이는 오류와 명백히 잘못된 답변에 크게 당황했다.

건국 초기 대통령 12명의 사진과 이름이 있는 표를 만들라고 하자 조지 워싱턴을 기어지 워싱지언(Gearge Washingion)으로, 토머스 제퍼슨을 토머슨 제퍼슨(Thomason Jefferson)으로 적는 등 어딘가 이가 빠진 결과물을 내뱉었다. 또 미국 지도를 그리고 주 이름을 표시하라고 하자 캘리포니아를 ‘칼포히아(CALFORHIA)’로, 아이다호를 ‘1오아호(1OAHO)’로 엉뚱하게 표기했다. 이에 이용자들은 GPT-5가 그린 잘못된 지도를 사회관계망서비스(SNS)에 경쟁하듯 게시하며 낮은 성능을 비웃었다.

일각에서는 GPT-5가 이전 버전인 ‘GPT-4o’보다 오히려 못하다며 기존 모델을 되살리라고 온라인 청원 운동을 벌였고, 오픈AI도 결국 이를 받아들였다.

올트먼 CEO는 지난 9일 엑스(X·옛 트위터) 게시물을 통해 “(모델의) ‘자동전환장치’가 고장 나 사용 불가 상태여서 GPT-5가 실제보다 더 멍청해 보였다”며 “오늘부터는 더 똑똑해 보일 것”이라고 해명했다.

GPT-5에는 이용자의 질문에 따라 다양한 성능의 모델 중 가장 적합한 모델이 답변을 생성하게 하는 자동전환장치가 적용됐는데, 초기에 이 장치에 문제가 생겼다는 것이다. 그러나 CNN은 올트먼의 해명이 나온 이후에 미국 지도를 그리라는 지시를 내려봤지만, 결과물은 여전히 형편없었다고 지적했다.

챗GPT는 현재 주간 이용자가 약 7억명으로 세계에서 가장 많이 사용되는 생성형 AI다.

CNN은 GPT-5에 대한 이와 같은 이용자들의 실망을 오픈AI의 과대광고에 따른 필연적 결과로 분석했다. AI에 대한 비판자로 유명한 게리 마커스 뉴욕대 명예교수는 “오픈AI가 이처럼 어중간한 수준의 모델에 브랜드 이름을 내걸 줄은 생각지 못했다”며 “합리적인 세상이라면 그들의 기업가치가 타격을 입었을 것”이라고 꼬집었다.                                 <연합>

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

집 팔려면 4월 중순에 내놔라… 최적의 조건 ‘골디락스’ 주간
집 팔려면 4월 중순에 내놔라… 최적의 조건 ‘골디락스’ 주간

4월 12일~18일 비싸게 빨리 팔려동면’수요 깨어나 본격적인 봄 시즌이 시작되면서 올해 집을 팔 계획인 셀러들이 분주해지기 시작했다. 늦어도 봄 철에 집을 내놔야 여름 성수기를

콘도 판매 발목 잡는 마스터 보험… 대출 승인에 영향
콘도 판매 발목 잡는 마스터 보험… 대출 승인에 영향

HOA 의무 가입하는 보험보장 불충분 시 대출 거절서류 지연도 거래에 영향   마스터보험 보장이 불충분하면 해당 단지 내 모든 유닛이 대출 부적격 주택으로 분류될 수 있다. [준

무병장수를 위한 하루 몇 분의 변화…“수명 연장 가능”
무병장수를 위한 하루 몇 분의 변화…“수명 연장 가능”

■ 워싱턴포스트 특약 건강·의학 리포트수면 5분·운동 2분·채소 한 접시“1년 연장”세 가지 습관 함께 바꾸면‘시너지’극대화“작은 실천이 건강수명·기대수명 좌우 가능” 이 작은 변

법원, '대학입학생 성별·인종 공개하라' 트럼프 요구에 제동
법원, '대학입학생 성별·인종 공개하라' 트럼프 요구에 제동

'백인 차별' 검증 목적 의심…진보성향 17개주·대학협회 등 소송전  연방법원이 도널드 트럼프 행정부가 대학들에 요구해 온 인종·성별 입학통계 제출에 제동을 걸었다.4일 일간 뉴욕

"고추장 더 넣어도 되나요?"…LA서 재현된 '폭군의셰프' 속 한식
"고추장 더 넣어도 되나요?"…LA서 재현된 '폭군의셰프' 속 한식

비빔밥·된장국·갈비찜 시연 후 체험…"집에 가서도 만들어보고 싶어"  4일 로스앤젤레스(LA) 한국문화원에서 열린 'K-푸드 쿠킹 클래스'에서 '폭군의 셰프' 속 비프 부르기뇽과

무종교 24% 역대 최고… 30세미만은 개신교 앞질러
무종교 24% 역대 최고… 30세미만은 개신교 앞질러

■2025년 종교인 갤럽 조사‘종교 중요하다’50% 밑으로‘유대인·젊은 층’낮게 평가종교 활동 참여도도 감소세 종교를 중요하게 여기는 미국인 비율이 지속적으로 감소세 지난해 50%

자고 일어나면 시력 좋아진다? 우리 아이 ‘드림렌즈’ 고민이라면
자고 일어나면 시력 좋아진다? 우리 아이 ‘드림렌즈’ 고민이라면

■ 이채연 중앙대병원 안과 교수스마트폰 등 근거리 작업 증가에 소아 근시 유병률 급증부모 모두 근시라면 자녀의 근시 발생 위험 최대 11.4배7~9세가 골든타임… 고도근시 막으려면

유가 급등에 타격 큰 자동차는?… 미국 브랜드 직격탄
유가 급등에 타격 큰 자동차는?… 미국 브랜드 직격탄

고급 수입차·미국업체 트럭 연간 835달러 추가 부담소형·하이브리드 수요 늘 것유류비 절약 팁 SNS 공유 열풍   이란 전쟁 여파로 유가가 급등하는 가운데, 미국 브랜드 픽업트럭

SAT 부활·AI 로 에세이 평가… 대학 입시 트렌드 재편
SAT 부활·AI 로 에세이 평가… 대학 입시 트렌드 재편

SAT 점수 ‘제출 vs. 선택’ 양분커뮤니티 칼리지 등록 증가중상위권 대학 다양성 증가AI 에세이 평가 시스템 도입 오랜 기간 명문 대학 입학은 예측 가능한 공식처럼 여겨져 왔다

명문대 합격 ‘공식’ 없어… 단일 지표 아닌 전체 맥락이 중요
명문대 합격 ‘공식’ 없어… 단일 지표 아닌 전체 맥락이 중요

여름 방학 전략적 활용해야 ‘경쟁력’ 여름 프로그램 참여주도적 연구 활동에 집중‘ SAT·ACT’시험 준비 아이비리그 등 명문대는 합격자 선발 시 단일 지표가 아닌 전체적인 맥락을

이상무가 간다 yotube 채널