한국일보 애틀랜타
첫광고
김성희 부동산
이규 레스토랑

AI 시대… ‘정확성’ 논란 가열

미국뉴스 | 사회 | 2025-05-08 08:50:01

AI 시대, 정확성 논란,오류율 더 높아

구양숙 부동산표정원 융자미국 크래딧 교정

최신 모델, 오류율 더 높아져

사실과 허구 혼동 ‘환각 현상’

오픈AI·구글 등 최대 79% 기록

 

지난달 프로그래밍 도구 ‘커서(Cursor)’의 고객 지원용 인공지능(AI) 챗봇이 허구의 회사 정책을 사용자들에게 안내해 한바탕 소동이 벌어졌다. 챗봇은 “이제 한 대의 컴퓨터에서만 사용할 수 있다”는 잘못된 공지를 보냈고 이에 분노한 일부 고객은 계정을 해지했다. 이후 AI의 잘못된 응답임이 드러나자 사용자들의 불만은 더 커졌다. 커서의 최고경영자(CEO) 마이클 트루엘은 온라인 게시판에 “그런 정책은 없다”며 “AI 챗봇의 오류로 잘못된 안내가 나갔다”고 해명하며 부랴부랴 사태를 수습했다.

 

뉴욕타임스(NYT)는 이 같은 인공지능의 ‘환각(hallucination)’ 현상이 점점 더 심해지고 있다고 지난 6일 보도했다. AI 챗봇이 점점 더 많은 업무에 활용되고 있지만 그 정확성은 여전히 보장되지 않고 있다는 것이다. NYT에 따르면 오픈AI, 구글, 중국 딥시크 등 주요 AI 기업이 내놓은 최신 ‘추론(reasoning)’ 모델들은 수학 능력은 향상됐지만 사실관계에서는 오히려 취약한 모습을 보였다.

 

특히 선두주자인 오픈AI의 최신 모델은 자체 테스트에서 최대 79%의 오류율을 보였다고 NYT는 전했다. 오픈AI에 따르면 최신 모델 ‘o3’는 유명인사 관련 질문에 답하는 테스트(PersonQA)에서 33%의 오류율을 보였으며, ‘o4-mini’는 48%에 달했다. 일반 상식 문제(SimpleQA)에서는 o3가 51%, o4-mini는 무려 79%의 오류율을 기록했다. 이는 이전 모델(o1)의 44%보다 높은 수치다.

 

AI 시스템은 방대한 데이터를 학습해 확률적으로 가장 그럴듯한 답을 예측하는 방식으로 작동한다. 이 과정에서 사실과 허구를 구분하지 못하고 ‘지어내는’ 현상이 발생한다. 이 때문에 전문가들은 “AI가 근본적으로 오류를 완전히 피할 수는 없다”고 지적한다. 아마르 아와달라 벡타라(Vectara) CEO는 “AI의 환각은 완전히 사라지지 않을 문제”라며 “이런 시스템은 항상 일정 비율의 오류를 내포할 수밖에 없다”고 말했다.

 

전문가들은 AI의 환각 현상이 발생하는 배경에 대해 ‘추론 과정’을 거치면서 단계별로 오류가 축적됐기 때문이라고 지적한다. 최신 AI는 복잡한 문제를 단계별로 풀이하고 각 단계를 사용자에게 보여주는데, 이때 매 단계마다 잘못된 추론이 쌓이면 최종 답변도 왜곡될 수 있다는 것이다.

 

에든버러대 로라 페레즈-벨트라치니 연구원은 “AI는 특정 과업에 집중하는 동안 다른 기능을 잊어버리기도 한다”며 “이 때문에 일부 영역에서는 성능이 좋아지지만 다른 영역에서는 오류가 증가한다”고 설명했다.

 

NYT에 따르면 벡타라가 뉴스 기사 요약 테스트를 통해 측정한 환각율은 1~2%대까지 낮아졌다가 최신 추론 모델에서는 다시 증가했다. 오픈AI의 o3는 6.8%, 딥시크의 R1은 14.3%의 오류율을 기록했다. 이에 대해 오픈AI 대변인은 “모델의 정확성과 신뢰성을 높이기 위해 환각 문제 연구를 지속하고 있다”고 밝혔다.

 

한편 일부 전문가들은 AI의 환각 문제를 해결하기 위해 AI가 추론에 사용한 데이터 출처까지 추적해 분석하려는 시도를 하고 있다. 하지만 AI가 학습한 데이터량이 방대해 여전히 사각지대가 존재하는 것으로 알려졌다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

[애틀랜타 뉴스] 새해부터 적신호 우회전 금지하는 애틀랜타, 40만불 벌금 부과한 HOA, 불법체류자 대규모 단속에 긴장하는 한인사회, 애피타이져 경제, 조지아의 다양한 뉴스부터 애틀랜타 한인 사회 동정까지 (영상)
[애틀랜타 뉴스] 새해부터 적신호 우회전 금지하는 애틀랜타, 40만불 벌금 부과한 HOA, 불법체류자 대규모 단속에 긴장하는 한인사회, 애피타이져 경제, 조지아의 다양한 뉴스부터 애틀랜타 한인 사회 동정까지 (영상)

12월 셋째 주 애틀랜타 이상무 종합 뉴스는 꼭 알아야 할 조지아의 다양한 소식부터 애틀랜타 한인 동포 사회의 동정까지 전해드립니다. 새해부터 적신호 우회전 금지하는 애틀랜타, 4

"내년 조지아 경제 침체 가능성..고용시장은 안정"
"내년 조지아 경제 침체 가능성..고용시장은 안정"

UGA 경제전망 보고서관세전쟁·이민정책 등 워싱턴발 경제역풍 탓 내년 조지아 경제는 전국적인 경제 역풍 영향으로 경기 침체 가능성이  높아지겠지만 고용시장은 비교적 안정세를 보일

더글라스빌 부부, 새는 변기에 '수도요금 폭탄' 환불 받아
더글라스빌 부부, 새는 변기에 '수도요금 폭탄' 환불 받아

변기서 물 새, 두 달 1500불 부과돼 더글라스빌에 거주하는 한 부부가 수개월간의 전화와 이메일 끝에 치솟는 수도 요금 문제로 온라인 부동산 관리 회사로부터 1,500달러를 환불

ACA 추가가입  내년 1월 15일까지 가능
ACA 추가가입 내년 1월 15일까지 가능

조지아액서스 통해2월부터 보험효력 15일로 오바마케어(ACA) 내년도 공개가입 기간이 종료됐지만 조지아 주민에게는 추가 가입 기간이 부여된다.조지아 자체 ACA 거래소인 조지아액세

'피치 드롭' 대신 '드론쇼·불꽃놀이'
'피치 드롭' 대신 '드론쇼·불꽃놀이'

올 제야·새해맞이 행사 변경애틀랜타시 "비용때문에..." 최근 수년동안 오락가락했던 애틀랜타 새해맞이 ‘피치 드롭’행사가 올해에도 볼 수 없게 됐다. 대신 불꽃놀이와 드론 쇼가 선

〈한인타운 동정〉 '고베 반지천국 애틀랜타 연말 대세일'
〈한인타운 동정〉 '고베 반지천국 애틀랜타 연말 대세일'

고베 반지천국 애틀랜타 연말 대세일12월 19일-23일 둘루스 시온마켓 특설매장에서 최대 80% 세일을 진행한다. 제품고객 전원에게 고급 스카프 무료 증정한다. 영업시간 오전 10

첫 주택구입 연령 40세...젊은층 내집 마련 '빨간불'
첫 주택구입 연령 40세...젊은층 내집 마련 '빨간불'

우선순위 변화, 학자금 대출 족쇄가격 상승에 소득 못미쳐, 대형화 베이비붐 세대가 젊은 성인이었을 때, 일반적인 첫 주택 구매자의 나이는 23세에 불과했다. 그러나 2025년 현재

“멀쩡한데… 지붕 안바꾸면 보험 해지한다고?”…조지아 주택보험 규정 새해부터 바뀐다
“멀쩡한데… 지붕 안바꾸면 보험 해지한다고?”…조지아 주택보험 규정 새해부터 바뀐다

보험해지 통보기간 30→60일비과세 '재난 저축계좌' 신설도  #>캅 카운티에 거주하고 있는 한인 김 모씨는 지난 해 10월께 자신이 주택보험을 가입하고 있는 보험사로부터 편

세킨저 고교생들, 조지아주 양궁대회 대거 입상
세킨저 고교생들, 조지아주 양궁대회 대거 입상

최하윤 금메달, 이이레 동메달 세킨저 하이스쿨(Seckinger High School) 재학생 양궁 선수들이 조지아 주(State) 대회에서 뛰어난 성과를 거두며 주목을 받고 있다

마지막 페니…올해 찍은 1센트 동전 232세트 1천676만 달러에 팔려
마지막 페니…올해 찍은 1센트 동전 232세트 1천676만 달러에 팔려

지난 12일 경매에서 낙찰된 미국 마지막 1센트 동전 세트[스택스 보워스 갤러리 홈페이지 캡처. 재판매 및 DB 금지]  도널드 트럼프 미국 대통령의 지시로 생산이 중단된 1센트(

이상무가 간다 yotube 채널