한국일보 애틀랜타
김성희 부동산
첫광고
이규 레스토랑

AI 시대… ‘정확성’ 논란 가열

미국뉴스 | 사회 | 2025-05-08 08:50:01

AI 시대, 정확성 논란,오류율 더 높아

구양숙 부동산표정원 융자미국 크래딧 교정

최신 모델, 오류율 더 높아져

사실과 허구 혼동 ‘환각 현상’

오픈AI·구글 등 최대 79% 기록

 

지난달 프로그래밍 도구 ‘커서(Cursor)’의 고객 지원용 인공지능(AI) 챗봇이 허구의 회사 정책을 사용자들에게 안내해 한바탕 소동이 벌어졌다. 챗봇은 “이제 한 대의 컴퓨터에서만 사용할 수 있다”는 잘못된 공지를 보냈고 이에 분노한 일부 고객은 계정을 해지했다. 이후 AI의 잘못된 응답임이 드러나자 사용자들의 불만은 더 커졌다. 커서의 최고경영자(CEO) 마이클 트루엘은 온라인 게시판에 “그런 정책은 없다”며 “AI 챗봇의 오류로 잘못된 안내가 나갔다”고 해명하며 부랴부랴 사태를 수습했다.

 

뉴욕타임스(NYT)는 이 같은 인공지능의 ‘환각(hallucination)’ 현상이 점점 더 심해지고 있다고 지난 6일 보도했다. AI 챗봇이 점점 더 많은 업무에 활용되고 있지만 그 정확성은 여전히 보장되지 않고 있다는 것이다. NYT에 따르면 오픈AI, 구글, 중국 딥시크 등 주요 AI 기업이 내놓은 최신 ‘추론(reasoning)’ 모델들은 수학 능력은 향상됐지만 사실관계에서는 오히려 취약한 모습을 보였다.

 

특히 선두주자인 오픈AI의 최신 모델은 자체 테스트에서 최대 79%의 오류율을 보였다고 NYT는 전했다. 오픈AI에 따르면 최신 모델 ‘o3’는 유명인사 관련 질문에 답하는 테스트(PersonQA)에서 33%의 오류율을 보였으며, ‘o4-mini’는 48%에 달했다. 일반 상식 문제(SimpleQA)에서는 o3가 51%, o4-mini는 무려 79%의 오류율을 기록했다. 이는 이전 모델(o1)의 44%보다 높은 수치다.

 

AI 시스템은 방대한 데이터를 학습해 확률적으로 가장 그럴듯한 답을 예측하는 방식으로 작동한다. 이 과정에서 사실과 허구를 구분하지 못하고 ‘지어내는’ 현상이 발생한다. 이 때문에 전문가들은 “AI가 근본적으로 오류를 완전히 피할 수는 없다”고 지적한다. 아마르 아와달라 벡타라(Vectara) CEO는 “AI의 환각은 완전히 사라지지 않을 문제”라며 “이런 시스템은 항상 일정 비율의 오류를 내포할 수밖에 없다”고 말했다.

 

전문가들은 AI의 환각 현상이 발생하는 배경에 대해 ‘추론 과정’을 거치면서 단계별로 오류가 축적됐기 때문이라고 지적한다. 최신 AI는 복잡한 문제를 단계별로 풀이하고 각 단계를 사용자에게 보여주는데, 이때 매 단계마다 잘못된 추론이 쌓이면 최종 답변도 왜곡될 수 있다는 것이다.

 

에든버러대 로라 페레즈-벨트라치니 연구원은 “AI는 특정 과업에 집중하는 동안 다른 기능을 잊어버리기도 한다”며 “이 때문에 일부 영역에서는 성능이 좋아지지만 다른 영역에서는 오류가 증가한다”고 설명했다.

 

NYT에 따르면 벡타라가 뉴스 기사 요약 테스트를 통해 측정한 환각율은 1~2%대까지 낮아졌다가 최신 추론 모델에서는 다시 증가했다. 오픈AI의 o3는 6.8%, 딥시크의 R1은 14.3%의 오류율을 기록했다. 이에 대해 오픈AI 대변인은 “모델의 정확성과 신뢰성을 높이기 위해 환각 문제 연구를 지속하고 있다”고 밝혔다.

 

한편 일부 전문가들은 AI의 환각 문제를 해결하기 위해 AI가 추론에 사용한 데이터 출처까지 추적해 분석하려는 시도를 하고 있다. 하지만 AI가 학습한 데이터량이 방대해 여전히 사각지대가 존재하는 것으로 알려졌다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

트럼프 “이민자 시민권도 박탈한다”
트럼프 “이민자 시민권도 박탈한다”

“귀화자 박탈 기준 검토” NYT, 월 100~200건 선별도널드 트럼프 대통령이 귀화 시민권자를 대상으로 한 시민권 박탈 기준을 검토하고 있다고 밝혀 파장이 일고 있다.뉴욕타임스

H-1B 비자 등 최대 3천달러 육박… 이민 신청 급행 수수료 또 오른다
H-1B 비자 등 최대 3천달러 육박… 이민 신청 급행 수수료 또 오른다

프리미엄 프로세싱 인상3월1일부터 전면적 조정취업·유학비자 전반 영향  연방 이민서비스국(USCIS)이 H-1B 비자를 포함한 주요 이민 관련 신청서의 급행 처리 프리미엄 프로세싱

재외국민 4분의 1이 노인 ‘초고령 사회’
재외국민 4분의 1이 노인 ‘초고령 사회’

<사진=Shutterstock>  행안부 주민등록 통계65세 이상 18% → 25%고령화 속도 더 가팔라 재외국민 사회의 노인 인구 비율이 집계 이래 처음으로 25%에

“집값보다 무서운 유지비”… 올해도 재산세·보험료↑
“집값보다 무서운 유지비”… 올해도 재산세·보험료↑

각종 비용이 주택시장 변수바이어·홈오너 추가 부담에스크로 비용까지 급등모기지 연체율 상승 현실 새해 주택시장에서 재산세와 주택보험료, 모기지 비용 급증이 주택 소유자들이 직면할 최

이란 시위 사망자 폭증… 트럼프, 이란 군사개입 준비 착수
이란 시위 사망자 폭증… 트럼프, 이란 군사개입 준비 착수

반정부 시위 통제불능강경 진압·시위대에 발포  11일 영국 런던에서 열린 이란 정부에 대한 항의시위에서 참가자들이 이란 최고지도자 아야톨라 하메네이의 사진을 불태우고 있다. [로이

“한인 프리스쿨서 4세 여아 성추행 피해” 주장

“여교사가 부적절 접촉” 학부모, 민사소송 제기 학교·교사·원장 상대로 LA 한인타운에 위치한 한인 운영 프리스쿨에서 4세 여아가 교사로부터 성적으로 부적절한 접촉을 당했다는 주장

‘수퍼맨’ 초판본 1,500만달러에 팔려
‘수퍼맨’ 초판본 1,500만달러에 팔려

1938년 코믹스 만화책   한때 할리웃 배우 니컬러스 케이지가 소장했던 ‘수퍼맨’ 코믹스의 1938년 초판본이 역대 최고가인 1,500만 달러에 팔렸다. 10일 BBC방송 등에

올해 금값 전망 엇갈려 평균 4,610달러로 7%↑

국제 금 가격 상승세가 지난해보다 크게 둔화해 올해 7% 상승할 것으로 시장 전문가들이 전망했다. 파이낸셜타임스(FT)에 따르면 11개 금융업체 전문가들의 올해 말 금 가격 전망치

“모기지 금리 인하 위해 2,000억달러 투입”

트럼프, 채권매입 지시 도널드 트럼프 대통령이 8일 주택 구매 부담을 낮추기 위해 국책모기지기관인 패니메와 프레디맥에 2,000억 달러 규모의 모기지 채권 매입을 지시했다. 정부는

세계식량가격지수 넉 달째 하락

작년 한 해로는 상승세 식품 가격 안정화로 세계식량가격지수가 4개월 연속 하락했다. 유엔 식량농업기구(FAO)가 9일 발표한 지난해 12월 기준 세계식량가격지수(2014∼2016년

이상무가 간다 yotube 채널