한국일보 애틀랜타
김성희 부동산
첫광고
이규 레스토랑

AI 시대… ‘정확성’ 논란 가열

미국뉴스 | 사회 | 2025-05-08 08:50:01

AI 시대, 정확성 논란,오류율 더 높아

구양숙 부동산표정원 융자미국 크래딧 교정

최신 모델, 오류율 더 높아져

사실과 허구 혼동 ‘환각 현상’

오픈AI·구글 등 최대 79% 기록

 

지난달 프로그래밍 도구 ‘커서(Cursor)’의 고객 지원용 인공지능(AI) 챗봇이 허구의 회사 정책을 사용자들에게 안내해 한바탕 소동이 벌어졌다. 챗봇은 “이제 한 대의 컴퓨터에서만 사용할 수 있다”는 잘못된 공지를 보냈고 이에 분노한 일부 고객은 계정을 해지했다. 이후 AI의 잘못된 응답임이 드러나자 사용자들의 불만은 더 커졌다. 커서의 최고경영자(CEO) 마이클 트루엘은 온라인 게시판에 “그런 정책은 없다”며 “AI 챗봇의 오류로 잘못된 안내가 나갔다”고 해명하며 부랴부랴 사태를 수습했다.

 

뉴욕타임스(NYT)는 이 같은 인공지능의 ‘환각(hallucination)’ 현상이 점점 더 심해지고 있다고 지난 6일 보도했다. AI 챗봇이 점점 더 많은 업무에 활용되고 있지만 그 정확성은 여전히 보장되지 않고 있다는 것이다. NYT에 따르면 오픈AI, 구글, 중국 딥시크 등 주요 AI 기업이 내놓은 최신 ‘추론(reasoning)’ 모델들은 수학 능력은 향상됐지만 사실관계에서는 오히려 취약한 모습을 보였다.

 

특히 선두주자인 오픈AI의 최신 모델은 자체 테스트에서 최대 79%의 오류율을 보였다고 NYT는 전했다. 오픈AI에 따르면 최신 모델 ‘o3’는 유명인사 관련 질문에 답하는 테스트(PersonQA)에서 33%의 오류율을 보였으며, ‘o4-mini’는 48%에 달했다. 일반 상식 문제(SimpleQA)에서는 o3가 51%, o4-mini는 무려 79%의 오류율을 기록했다. 이는 이전 모델(o1)의 44%보다 높은 수치다.

 

AI 시스템은 방대한 데이터를 학습해 확률적으로 가장 그럴듯한 답을 예측하는 방식으로 작동한다. 이 과정에서 사실과 허구를 구분하지 못하고 ‘지어내는’ 현상이 발생한다. 이 때문에 전문가들은 “AI가 근본적으로 오류를 완전히 피할 수는 없다”고 지적한다. 아마르 아와달라 벡타라(Vectara) CEO는 “AI의 환각은 완전히 사라지지 않을 문제”라며 “이런 시스템은 항상 일정 비율의 오류를 내포할 수밖에 없다”고 말했다.

 

전문가들은 AI의 환각 현상이 발생하는 배경에 대해 ‘추론 과정’을 거치면서 단계별로 오류가 축적됐기 때문이라고 지적한다. 최신 AI는 복잡한 문제를 단계별로 풀이하고 각 단계를 사용자에게 보여주는데, 이때 매 단계마다 잘못된 추론이 쌓이면 최종 답변도 왜곡될 수 있다는 것이다.

 

에든버러대 로라 페레즈-벨트라치니 연구원은 “AI는 특정 과업에 집중하는 동안 다른 기능을 잊어버리기도 한다”며 “이 때문에 일부 영역에서는 성능이 좋아지지만 다른 영역에서는 오류가 증가한다”고 설명했다.

 

NYT에 따르면 벡타라가 뉴스 기사 요약 테스트를 통해 측정한 환각율은 1~2%대까지 낮아졌다가 최신 추론 모델에서는 다시 증가했다. 오픈AI의 o3는 6.8%, 딥시크의 R1은 14.3%의 오류율을 기록했다. 이에 대해 오픈AI 대변인은 “모델의 정확성과 신뢰성을 높이기 위해 환각 문제 연구를 지속하고 있다”고 밝혔다.

 

한편 일부 전문가들은 AI의 환각 문제를 해결하기 위해 AI가 추론에 사용한 데이터 출처까지 추적해 분석하려는 시도를 하고 있다. 하지만 AI가 학습한 데이터량이 방대해 여전히 사각지대가 존재하는 것으로 알려졌다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

에이티즈 '골든 아워 : 파트 4', '빌보드 200' 3위 데뷔
에이티즈 '골든 아워 : 파트 4', '빌보드 200' 3위 데뷔

8번째 '톱 10' 앨범 기록그룹 에이티즈(ATEEZ)가 5일 오후 서울 영등포구 페어몬트 앰배서더 서울에서 열린 미니 13집 '골든 아워 : 파트 4(GOLDEN HOUR : P

44회 동남부체전 6월 5-6일 둘루스고에서
44회 동남부체전 6월 5-6일 둘루스고에서

15일 조직위 발대식 개최미래지향적 한인축제 지향 6월 5-6일 조지아주 둘루스고등학교에서 열리는 제 44회 동남부한인체육대회의 대회조직위원회 위촉 및 발대식이 지난 15일 둘루스

경희대 동문회 신년하례식 개최
경희대 동문회 신년하례식 개최

5월 헬렌 모임 준비 경희대학교 미동남부 동문회(회장 유은희)는 희망찬 2026년을 맞아 지난 15일 오후 설날을 기념하는 신년하례회를 둘루스 소반 식당에서 개최했다.동문들은 새해

‘심상찮은 여론’ 감지 트럼프, 조지아 온다
‘심상찮은 여론’ 감지 트럼프, 조지아 온다

연방하원 보선 지원차 19일 롬에 도널드 트럼프  대통령이 연방 하원의원 보궐선거 지원 유세를 위해 오는 19일 조지아를 방문한다. 조지아는 오는 3월 10일 연방하원 제14지역구

[영상] 상공 9천m 기내서 난투극 벌인 승객들…충격적인 순간 포착
[영상] 상공 9천m 기내서 난투극 벌인 승객들…충격적인 순간 포착

9천m 상공을 날고 있는 기내에서 난투극이 벌어져 항공기가 비상착륙하는 사태가 벌어졌습니다.로이터통신과 뉴욕포스트 등 외신 보도에 따르면 지난 12일(현지시간) 튀르키예 안탈리아를

국제장물조직 귀넷 아시안 남성에 중형
국제장물조직 귀넷 아시안 남성에 중형

귀넷 카운티 노크로스 거주 아시안 남성 콩 젠 니가 국제 장물 유통 조직을 운영한 혐의로 징역 7년과 벌금 10만 달러를 선고받았다. 니는 택배 절도 등으로 확보한 500만 달러 상당의 전자제품을 홍콩과 두바이 등지로 밀반출한 혐의를 받고 있으며, 이번 수사는 귀넷 복합범죄수사팀의 정한성 부장검사가 주도했다.

레이니어 호수 물속서 차량 발견
레이니어 호수 물속서 차량 발견

16일 오전 레이니어 호수 티드웰 파크 인근에서 물에 잠긴 차량이 발견되었다. 보트를 타던 시민의 신고를 받은 포사이스 셰리프국과 홀 카운티 잠수팀이 현장에 출동해 인양 작업을 벌이고 있으며, 현재 정확한 사고 경위와 인명 피해 여부를 조사 중이다.

애틀랜타 거래 주택 10채 중 7채  ‘호가 이하’
애틀랜타 거래 주택 10채 중 7채 ‘호가 이하’

지난해 메트로 애틀랜타 29개 카운티에서 거래된 주택의 69%가 호가보다 낮은 가격에 매매되었으며 평균 할인율은 7.3%를 기록했다. 이는 2015년 이후 가장 높은 수준이다. 레드핀은 매도 물량 증가를 원인으로 분석했으나 전문가들은 여전히 높은 주택 가격과 금리 부담으로 인해 완전한 구매자 시장 진입에는 시간이 걸릴 것으로 내다봤다.

태권도 통해 청소년 마약 퇴치 나선다
태권도 통해 청소년 마약 퇴치 나선다

청소년마약퇴치위원회(COYAD)와 국기원이 2026년 2월 11일, 청소년 마약 예방 활동 강화를 위한 업무협약(MOU)을 체결했습니다. 최근 심각해진 청소년 마약 문제에 공동 대응하기 위해 마련된 이번 협약으로, 양 기관은 태권도 정신인 자기 통제와 책임감을 기반으로 한 건전한 청소년 문화 조성에 나섭니다. 앞으로 COYAD는 교육 콘텐츠를 제공하고, 국기원은 국내외 태권도 네트워크를 활용해 예방 교육과 캠페인을 전개하며 마약으로부터 안전한 사회 환경을 만드는 데 협력할 방침입니다.

최장수 애니 '심슨 가족' 800회 맞아…"종영은 멀었다"
최장수 애니 '심슨 가족' 800회 맞아…"종영은 멀었다"

1987년 시작돼 30년 가까이 황금시간대 지킨 애니…미 중산층 가족 다뤄'심슨 가족' 벽화[EPA=연합뉴스. 재판매 및 DB 금지] 미국의 최장수 시트콤 애니메이션 시리즈인 '심

이상무가 간다 yotube 채널