한국일보 애틀랜타
첫광고
김성희 부동산
이규 레스토랑

“대화형 AI 언어모델 4개 비교해보니…”

미국뉴스 | 경제 | 2023-08-21 09:41:15

대화형 AI 언어모델

구양숙 부동산표정원 융자미국 크래딧 교정

“GPT-4가 가장 우수해” 여전히 정보 오류 빈발

 

대화형 인공지능(AI) 서비스인 챗GPT 개발사 오픈AI의 대규모 언어모델(LLMs) GPT-4가 다른 LLM보다 우수한 능력을 보인다는 연구 결과가 나왔다. 반면에 AI 개발 스타트업 코히어(Cohere) AI가 잘못된 정보를 그럴듯하게 제시(환각·hallucination)하는 것으로 나타났다.

 

머신러닝(기계학습) 모니터링 플랫폼인 아더(Arthur) AI는 17일 GPT와 코히어 AI, 메타의 라마2, 미 AI 스타트업인 앤스로픽의 클로드2 등 4개 언어 모델을 비교 분석한 보고서를 발간했다. 이번 비교에 구글의 언어 모델은 포함되지 않았다.

 

연구팀은 수학과 미국 대통령, 모로코 정치 지도자에 관한 질문을 던져 AI 모델들의 정답을 비교하고, 이들 모델이 ‘AI 모델로서, 나는 의견을 제공할 수 없다’는 답을 제시해 오답의 위험을 회피하는지를 시험했다.

 

연구팀은 전체적으로 GPT-4가 테스트 된 모든 모델 중 가장 우수한 성능을 보였다고 설명했다.

 

GPT-4는 이전 버전인 GPT-3.5보다 ‘환각’이 적었고, 수학 문제에서는 범주에 따라 33%에서 50% 적은 환각을 보였다고 설명했다.

 

반면, 메타의 라마2는 GPT-4나 클로드2보다 전반적으로 더 많은 환각을 보이는 것으로 조사됐다.

 

수학 부문에서 GPT-4와 클로드2는 30개 문제 가운데 9개와 6개의 정답을 각각 제시해 정답률 1, 2위를 차지했다. 라마2와 코히어는 한 개도 맞히지 못했다.

 

미국 대통령과 관련한 33개 질문에서는 클로드2가 15개의 정답을 제시했고 GPT-4(11개), 라마2(9개), 코히어(4개) 순이었다.

 

모로코 정치 지도자와 관련한 30개 질문에서는 GPT-4가 절반(15개)의 정답을 제시한데 비해 라마2와 클로드2는 각각 2개와 1개에 그쳤다. 코히어는 30개 모두 환각을 생성했다.

 

‘AI 모델로서, 나는 의견을 제공할 수 없다’는 답을 제시하는 비율은 GPT-4가 2.9%로 가장 높았다. 이는 GPT-3.5의 2.2%보다도 더 높게 나타났다. 연구팀은 “이는 GPT-3.5보다 GPT-4를 사용하기 더 답답하다는 이용자들의 제기된 문제의 증거를 정량화한 것”이라고 설명했다.

 

코히어의 AI 모델은 어떤 응답에서도 ‘나는 의견을 제공할 수 없다’는 답을 내놓지 않았다.

 

댓글 0

의견쓰기::상업광고,인신공격,비방,욕설,음담패설등의 코멘트는 예고없이 삭제될수 있습니다. (0/100자를 넘길 수 없습니다.)

연준, 이란전쟁 불확실성 속 두차례 연속 금리 동결
연준, 이란전쟁 불확실성 속 두차례 연속 금리 동결

지난해 9·10·12월 3연속 인하 후 올해 1·3월 내리 동결기준금리 중간값, 올해말 3.4%로 유지…연내 한차례 인하 가능성올해 미성장률 2.4%로 0.1%P 올려…PCE 물가

온라인 시험서 전 학생 만점…"이게 말이 돼"
온라인 시험서 전 학생 만점…"이게 말이 돼"

GA 대학가 AI 부정행위 비상의심사례 최근 수 배 늘어나대면시험 확대 등 대책 골몰  대학생들이 온라인 시험과 과제물 작성에 인공지능(AI)을 활용하는 소위 ‘부정행위’가 늘면서

귀넷공립학교 유치원 등록 진행중
귀넷공립학교 유치원 등록 진행중

온라인 신청 접수 중 귀넷 카운티 공립학교(GCPS)는 2026-27학년도 유치원(Kindergarten) 과정에 새롭게 합류할 신입생 등록을 온라인으로 신청받고 있다.지난 16일

노스포인트몰, 애틀랜타 최대 복합 단지 되나
노스포인트몰, 애틀랜타 최대 복합 단지 되나

알파레타시에 용도변경 신청NHL팀 유치 최대 관건 부상  알파레타 노스포인트몰 개발계획이 점차 가시화되고 있다. 동시에 북미 프로아이스하키 리그(NHL)팀 유치 가능성 여부가 다시

식당 샐러드 속에 면도날이…고객 “죽을 뻔”
식당 샐러드 속에 면도날이…고객 “죽을 뻔”

음식 먹던 고객 입·혀 부상모로우 경찰, 고의성 조사  식당에서 주문한 음식 속에 있던 면도날로 인해 고객이 상처를 입는 일이 벌어졌다. 경찰은 즉각 사건 경위에 대해 조사에 나섰

펜타닐 적발되면 최소 2년 반 징역
펜타닐 적발되면 최소 2년 반 징역

4g 이상 소지자…최대 33년형  앞으로 조지아에서는 소량의 펜타닐이라도 소지하다 적발된 경우 최소 수년의 실형을 받게 된다.16일 주상원은 펜타닐 관련 형사처벌을 크게 강화한 법

복권 300여장 훔친 커플 체포
복권 300여장 훔친 커플 체포

당첨금 교환하려다 신분 노출 애틀랜타의 한 커플이 사업장에 침입해 수천 달러의 현금과 수백 장의 복권을 훔친 뒤, 대담하게도 당첨금을 수령하려다 경찰에 덜미를 잡혔다.경찰에 따르면

애틀랜타 공항 대혼란... "최소 4시간 전 도착해야"
애틀랜타 공항 대혼란... "최소 4시간 전 도착해야"

폭풍우·결빙 항공 수 백편 결항셧다운으로 TSA 요원 36% 결근 애틀랜타 하츠필드-잭슨 국제공항이 이번 주 기상 악화와 연방 정부 셧다운이라는 '이중고'를 맞으며 수만 명의 여행

조지아, 고등학생 교내 정치활동 허용 추진
조지아, 고등학생 교내 정치활동 허용 추진

관련 법안 주의회 통과 앞둬통과 시 전국 첫 사례 ‘주목’ 조지아 공립학교 학생들의 정치적 표현과 활동을 보호하는 법안이 주의회 통과를 앞두고 있다. 법안이 통과되면 조지아는 학생

조지아텍서 한국영화 무료 상영
조지아텍서 한국영화 무료 상영

20일... 하와이 연가 등 조지아텍의 연례 ‘글로벌 미디어 페스티벌’ 기간 한인 이민사를 다룬 한국 다큐멘터리 영화 2편이 상영된다.오는 20일 금요일 오후 12시부터 4시까지

이상무가 간다 yotube 채널