한국일보 애틀랜타
첫광고
김성희 부동산
이규 레스토랑

AI 시대… ‘정확성’ 논란 가열

미국뉴스 | 사회 | 2025-05-08 08:50:01

AI 시대, 정확성 논란,오류율 더 높아

권순상 노흥성 부동산 470-218-6136표정원 융자미국 크래딧 교정

최신 모델, 오류율 더 높아져

사실과 허구 혼동 ‘환각 현상’

오픈AI·구글 등 최대 79% 기록

 

지난달 프로그래밍 도구 ‘커서(Cursor)’의 고객 지원용 인공지능(AI) 챗봇이 허구의 회사 정책을 사용자들에게 안내해 한바탕 소동이 벌어졌다. 챗봇은 “이제 한 대의 컴퓨터에서만 사용할 수 있다”는 잘못된 공지를 보냈고 이에 분노한 일부 고객은 계정을 해지했다. 이후 AI의 잘못된 응답임이 드러나자 사용자들의 불만은 더 커졌다. 커서의 최고경영자(CEO) 마이클 트루엘은 온라인 게시판에 “그런 정책은 없다”며 “AI 챗봇의 오류로 잘못된 안내가 나갔다”고 해명하며 부랴부랴 사태를 수습했다.

 

뉴욕타임스(NYT)는 이 같은 인공지능의 ‘환각(hallucination)’ 현상이 점점 더 심해지고 있다고 지난 6일 보도했다. AI 챗봇이 점점 더 많은 업무에 활용되고 있지만 그 정확성은 여전히 보장되지 않고 있다는 것이다. NYT에 따르면 오픈AI, 구글, 중국 딥시크 등 주요 AI 기업이 내놓은 최신 ‘추론(reasoning)’ 모델들은 수학 능력은 향상됐지만 사실관계에서는 오히려 취약한 모습을 보였다.

 

특히 선두주자인 오픈AI의 최신 모델은 자체 테스트에서 최대 79%의 오류율을 보였다고 NYT는 전했다. 오픈AI에 따르면 최신 모델 ‘o3’는 유명인사 관련 질문에 답하는 테스트(PersonQA)에서 33%의 오류율을 보였으며, ‘o4-mini’는 48%에 달했다. 일반 상식 문제(SimpleQA)에서는 o3가 51%, o4-mini는 무려 79%의 오류율을 기록했다. 이는 이전 모델(o1)의 44%보다 높은 수치다.

 

AI 시스템은 방대한 데이터를 학습해 확률적으로 가장 그럴듯한 답을 예측하는 방식으로 작동한다. 이 과정에서 사실과 허구를 구분하지 못하고 ‘지어내는’ 현상이 발생한다. 이 때문에 전문가들은 “AI가 근본적으로 오류를 완전히 피할 수는 없다”고 지적한다. 아마르 아와달라 벡타라(Vectara) CEO는 “AI의 환각은 완전히 사라지지 않을 문제”라며 “이런 시스템은 항상 일정 비율의 오류를 내포할 수밖에 없다”고 말했다.

 

전문가들은 AI의 환각 현상이 발생하는 배경에 대해 ‘추론 과정’을 거치면서 단계별로 오류가 축적됐기 때문이라고 지적한다. 최신 AI는 복잡한 문제를 단계별로 풀이하고 각 단계를 사용자에게 보여주는데, 이때 매 단계마다 잘못된 추론이 쌓이면 최종 답변도 왜곡될 수 있다는 것이다.

 

에든버러대 로라 페레즈-벨트라치니 연구원은 “AI는 특정 과업에 집중하는 동안 다른 기능을 잊어버리기도 한다”며 “이 때문에 일부 영역에서는 성능이 좋아지지만 다른 영역에서는 오류가 증가한다”고 설명했다.

 

NYT에 따르면 벡타라가 뉴스 기사 요약 테스트를 통해 측정한 환각율은 1~2%대까지 낮아졌다가 최신 추론 모델에서는 다시 증가했다. 오픈AI의 o3는 6.8%, 딥시크의 R1은 14.3%의 오류율을 기록했다. 이에 대해 오픈AI 대변인은 “모델의 정확성과 신뢰성을 높이기 위해 환각 문제 연구를 지속하고 있다”고 밝혔다.

 

한편 일부 전문가들은 AI의 환각 문제를 해결하기 위해 AI가 추론에 사용한 데이터 출처까지 추적해 분석하려는 시도를 하고 있다. 하지만 AI가 학습한 데이터량이 방대해 여전히 사각지대가 존재하는 것으로 알려졌다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

조지아주 대표 음식은 바로 이것
조지아주 대표 음식은 바로 이것

복숭아 대신 삶은 땅콩 복숭아는 비켜라. 피칸 파이도, 바비큐도 조지아의 상징 자리를 내줘야 할 판이다. 최근 발표된 새로운 전국 음식 순위에서 조지아주를 대표하는 가장 상징적인

21년 억울한 옥살이 끝에 자유의 몸
21년 억울한 옥살이 끝에 자유의 몸

조지아주 남성, DNA 검사로 무죄 입증 조지아주 풀턴 카운티에서 21년 가까이 억울한 옥살이를 해온 한 남성이 마침내 무죄를 선고받고 석방됐다. 그는 수감 기간 내내 자신의 결백

황병구 회장, "미주한상, 세계한상대회 성공시키겠다"
황병구 회장, "미주한상, 세계한상대회 성공시키겠다"

8월 미주한상대회, 9월 세계한상대회 준비바이어 유치 총력전, 베이스캠프 9월 개관 황병구 미주한인상공회의소 총회장 겸 세계한상대회 운영위원장이 애틀랜타를 찾아 올해 8월에 열리는

줄기세포 치료 '네이처셀' 애틀랜타 설명회 개최
줄기세포 치료 '네이처셀' 애틀랜타 설명회 개최

관절염, 알츠하이머, 당뇨, 자폐증 치료 효과9월부터 화장품 사업 출범, 대규모 연구시설 줄기세포 치료제 개발 기업 네이처셀이 미국 시장을 중심으로 재생의료 사업 확대에 속도를 내

‘백신 회의론’ 버렸나…FDA 자문위, mRNA 독감백신 승인 권고
‘백신 회의론’ 버렸나…FDA 자문위, mRNA 독감백신 승인 권고

식품의약국(FDA) 자문기구가 처음으로 메신저 리보핵산(mRNA) 독감 백신 승인에 청신호를 켰다.로이터통신과 PBS방송은 19일 FDA 산하 백신·생물의약품자문위원회(VRBPAC

중앙일보, 220억원 규모 어음 최종부도…워크아웃 공식 신청
중앙일보, 220억원 규모 어음 최종부도…워크아웃 공식 신청

한양증권 보유 CP 조기 상환 미이행JTBC는 360억원 규모 기업어음 1차 부도 처리 공시 유동성 위기를 겪고 있는 중앙일보가 발행한 220억원 규모의 기업어음(CP)이 19일(

애틀랜타 한인사회 월드컵 응원으로 하나돼
애틀랜타 한인사회 월드컵 응원으로 하나돼

한국, 수비 실수로 멕시코에 분패한인회 공동응원 일정 추후 발표  2026 북중미 월드컵 A조 조뱔리그 2차전 경기에서 대한민국 축구대표팀이 멕시코에게 0-1로 석패해 승점 추가에

86억달러 대형합병은행 애틀랜타에 둥지
86억달러 대형합병은행 애틀랜타에 둥지

시노버스∙피너클 합병 은행미드타운에 본사 임차계약   기존 시노버스 은행과  피너클 은행과의  86억달러에 달하는 합병으로 태어난 피너클 파이낸셜 파트너사(이하 피너클)가 애틀랜타

5년 새 조지아 집값 45% 상승…전국 16위
5년 새 조지아 집값 45% 상승…전국 16위

메인 1위…S.캐롤라이나 4위  최근 5년간 미 전역 주택가격이 큰 폭으로 오른 가운데 특히 북동부 지역에서의 상승폭이 큰 것으로 조사됐다. 이 기간 동안 조지아의 주택가격 상승폭

대규모 시민권 박탈…트럼프 행정부 강행
대규모 시민권 박탈…트럼프 행정부 강행

연방 법무부 취소소송수백건 추가로 추진이민 단속 확대 일환“합법이민 겨냥”논란 도널드 트럼프 행정부가 귀화 이민자들의 시민권까지 박탈하는 ‘시민권 취소(denaturalizatio

이상무가 간다 yotube 채널