한국일보 애틀랜타
이규 레스토랑
김성희 부동산
첫광고

AI 시대… ‘정확성’ 논란 가열

미국뉴스 | 사회 | 2025-05-08 08:50:01

AI 시대, 정확성 논란,오류율 더 높아

구양숙 부동산표정원 융자미국 크래딧 교정

최신 모델, 오류율 더 높아져

사실과 허구 혼동 ‘환각 현상’

오픈AI·구글 등 최대 79% 기록

 

지난달 프로그래밍 도구 ‘커서(Cursor)’의 고객 지원용 인공지능(AI) 챗봇이 허구의 회사 정책을 사용자들에게 안내해 한바탕 소동이 벌어졌다. 챗봇은 “이제 한 대의 컴퓨터에서만 사용할 수 있다”는 잘못된 공지를 보냈고 이에 분노한 일부 고객은 계정을 해지했다. 이후 AI의 잘못된 응답임이 드러나자 사용자들의 불만은 더 커졌다. 커서의 최고경영자(CEO) 마이클 트루엘은 온라인 게시판에 “그런 정책은 없다”며 “AI 챗봇의 오류로 잘못된 안내가 나갔다”고 해명하며 부랴부랴 사태를 수습했다.

 

뉴욕타임스(NYT)는 이 같은 인공지능의 ‘환각(hallucination)’ 현상이 점점 더 심해지고 있다고 지난 6일 보도했다. AI 챗봇이 점점 더 많은 업무에 활용되고 있지만 그 정확성은 여전히 보장되지 않고 있다는 것이다. NYT에 따르면 오픈AI, 구글, 중국 딥시크 등 주요 AI 기업이 내놓은 최신 ‘추론(reasoning)’ 모델들은 수학 능력은 향상됐지만 사실관계에서는 오히려 취약한 모습을 보였다.

 

특히 선두주자인 오픈AI의 최신 모델은 자체 테스트에서 최대 79%의 오류율을 보였다고 NYT는 전했다. 오픈AI에 따르면 최신 모델 ‘o3’는 유명인사 관련 질문에 답하는 테스트(PersonQA)에서 33%의 오류율을 보였으며, ‘o4-mini’는 48%에 달했다. 일반 상식 문제(SimpleQA)에서는 o3가 51%, o4-mini는 무려 79%의 오류율을 기록했다. 이는 이전 모델(o1)의 44%보다 높은 수치다.

 

AI 시스템은 방대한 데이터를 학습해 확률적으로 가장 그럴듯한 답을 예측하는 방식으로 작동한다. 이 과정에서 사실과 허구를 구분하지 못하고 ‘지어내는’ 현상이 발생한다. 이 때문에 전문가들은 “AI가 근본적으로 오류를 완전히 피할 수는 없다”고 지적한다. 아마르 아와달라 벡타라(Vectara) CEO는 “AI의 환각은 완전히 사라지지 않을 문제”라며 “이런 시스템은 항상 일정 비율의 오류를 내포할 수밖에 없다”고 말했다.

 

전문가들은 AI의 환각 현상이 발생하는 배경에 대해 ‘추론 과정’을 거치면서 단계별로 오류가 축적됐기 때문이라고 지적한다. 최신 AI는 복잡한 문제를 단계별로 풀이하고 각 단계를 사용자에게 보여주는데, 이때 매 단계마다 잘못된 추론이 쌓이면 최종 답변도 왜곡될 수 있다는 것이다.

 

에든버러대 로라 페레즈-벨트라치니 연구원은 “AI는 특정 과업에 집중하는 동안 다른 기능을 잊어버리기도 한다”며 “이 때문에 일부 영역에서는 성능이 좋아지지만 다른 영역에서는 오류가 증가한다”고 설명했다.

 

NYT에 따르면 벡타라가 뉴스 기사 요약 테스트를 통해 측정한 환각율은 1~2%대까지 낮아졌다가 최신 추론 모델에서는 다시 증가했다. 오픈AI의 o3는 6.8%, 딥시크의 R1은 14.3%의 오류율을 기록했다. 이에 대해 오픈AI 대변인은 “모델의 정확성과 신뢰성을 높이기 위해 환각 문제 연구를 지속하고 있다”고 밝혔다.

 

한편 일부 전문가들은 AI의 환각 문제를 해결하기 위해 AI가 추론에 사용한 데이터 출처까지 추적해 분석하려는 시도를 하고 있다. 하지만 AI가 학습한 데이터량이 방대해 여전히 사각지대가 존재하는 것으로 알려졌다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

‘고베쥬얼그룹’ 프리미엄 자석건강팔찌 돌풍
‘고베쥬얼그룹’ 프리미엄 자석건강팔찌 돌풍

한국 직수입 ‘순금도금 자석팔찌’ 출시품절 대란 속 스와니 아씨마켓 특별전 개최   최근 미 전역 한인 사회에서 ‘손목 위의 혁신’으로 불리며 뜨거운 화제를 모으고 있는 제품이 있

'2026년도 재외동포 초청 장학생' 모집

재외 동포 협력센터, 80명 선발모국·동포사회 상생발전에기여할 인재 대상 재외동포청 산하 공공기관인 재외동포협력센터(센터장 김영근)는 재외동포 사회와 대한민국 발전에 기여할 글로벌

장난이 부른 비극, 교사 사망 가해학생 전원 '무혐의'
장난이 부른 비극, 교사 사망 가해학생 전원 '무혐의'

검찰, 가해 학생 5명 형사기소 기각 조지아주 홀 카운티에서 장난이 비극으로 변하며 교사가 사망한 사건과 관련해, 기소됐던 학생 5명 전원에 대한 모든 혐의가 취하됐다.제이든 월리

민주 조지아 가스세 중단 촉구, 켐프 "지켜보자"
민주 조지아 가스세 중단 촉구, 켐프 "지켜보자"

민주당 "가스세 징수 중단하라"주지사 "상황 주시, 지켜볼 것" 가솔린 가격이 지속적으로 상승하면서 조지아 주민들이 출퇴근길과 가계 경제에 큰 부담을 느끼고 있다. 이에 민주당 의

조지아 여성 10명 유린 성폭행범 종신형
조지아 여성 10명 유린 성폭행범 종신형

60대 쿨리 가석방 없는 종신형15세-38세 여성 성폭행 범행 18년 동안 조지아주 일대에서 다수의 여성을 성폭행한 연쇄 성폭행범에게 가석방 없는 종신형이 선고됐다.지난 목요일,

공항 보안검색 정체 극심, 평소보다 일찍 도착해야
공항 보안검색 정체 극심, 평소보다 일찍 도착해야

이민정책 대립 DHS 예산 부결출발 시간보다 3시간 도착 권고 연방 정부의 부분 폐쇄(셧다운) 사태가 4주째로 접어든 가운데, 주말인 13일부터 애틀랜타 하츠필드-잭슨 국제공항을

샌디스프링스 시·주민, 20년 숙원 풀었다
샌디스프링스 시·주민, 20년 숙원 풀었다

USPS, 우편주소 기본 도시명애틀랜타→샌디스프링스 변경 연방우정국(USPS)이 샌디스프링스의 우편 주소 기본 도시명을 기존 애틀랜타에서 샌디스프링스로 변경하기로 했다.샌디스프링스

밴스 부통령 내달UGA 방문…조지아 정가 긴장
밴스 부통령 내달UGA 방문…조지아 정가 긴장

‘터닝 포인트’ 행사 참석 위해 예비선거 한 달 앞두고 관심↑ JD 밴스 부통령이 다음 달 조지아 대학교(UGA)를 방문한다.UGA의 보수 성향 학생단체인 터닝 포인트UGA 지부는

조지아서 유입인구가 가장 많은 카운티는?
조지아서 유입인구가 가장 많은 카운티는?

1위 채텀∙ 2위 클라크 카운티 순항만지역∙애틀랜타 교외권 상위  조지아 항만 지역과 메트로 애틀랜타 외곽지역이 인구 순유입규모가 두드러졌다는 조사 결과가 나왔다.부동산 데이터 분

한국일보 ‘세계 역사·문명·자연 기행’ 프로젝트…한인 5대 여행사와 함께 ‘최고의 여정’
한국일보 ‘세계 역사·문명·자연 기행’ 프로젝트…한인 5대 여행사와 함께 ‘최고의 여정’

업계 최고의 신뢰·검증된 명성 여행사들 동방, 드림, 삼호, 아주, 춘추 5개사 참여각 대표 상품… 한 차원 높은 VIP 서비스 한인 여행 수요 진작·관광 부흥 프로젝트 가나다 순

이상무가 간다 yotube 채널