챗GPT 20가지 상황 시나리오
정서인식 점수 일반인 평균 상회
챗GPT가 사람보다 더 사람의 감정을 잘 이해한다는 연구 결과가 발표됐다. 지금까지 챗GPT와 같은 생성형 인공지능(AI)은 주로 창작, 정보 제공, 업무 보조와 같은 생산성 제고 측면에서 주목을 끌었는데, 이번 연구결과를 바탕으로 감성 영역에서도 활용 가능성이 높아질 전망이다. 일각에서는 생성형AI의 침투 속도가 향후 아이돌봄, 정신과 치료 등 사람의 감정노동이 많이 소요되는 산업 영역으로 보다 확대될 것이라는 전망이 제기된다.
25일 AI 업계에 따르면 이스라엘 맥스스턴 에즈릴밸리대 연구팀은 최근 ‘감정 인식 평가에서 인간을 능가하는 챗GPT’ 제목의 연구 보고서를 국제 학술지 ‘심리학 프런티어스’에 발표했다.
보고서에 따르면 챗GPT는 인간 평균 수준보다 사람들의 감정을 더 잘 이해하고 표현하는 것으로 나타났다. 연구자들은 정서 인식(EA·Emotinal Awareness)이라는 정신병리학 개념을 활용해 챗GPT가 인간 감정을 얼마나 이해하고 있는지 여부를 평가했다. 학계에서는 정서 인식을 자신과 타인의 감정을 개념화하는 능력으로 정의하고 있다.
연구자들은 20가지의 상황별 시나리오를 제시하고 챗GPT가 해당 상황에 등장하는 타인의 감정에 대해 설명토록 하고 이를 수치화시켰다. 이 같은 평가는 올 1월과 2월 두 차례에 걸쳐 이뤄졌다. 첫 평가에서 챗GPT는 일반인 평균보다 훨씬 높은 성능을 보였다. 이어 진행된 두 번째 평가에서 또한 챗GPT는 일반인 평균을 크게 상회해, 획득 가능한 최대 점수에 도달한 것으로 알려졌다.
챗GPT와 같은 생성형 AI 출시가 ‘스마트폰 첫 출시’ 때와 비슷한 충격을 준 배경에는 압도적인 생산력이 자리하고 있다. 실제 지금까지 오픈AI, 구글, 메타 등이 선보였던 생성형 AI는 자연어를 이해해 정보, 창작물을 생성하거나 빠르게 기존 정보를 요약하는 등 주로 창작, 업무 보조 등에서 능력을 보여왔다.
실제 오픈AI와 같은 AI 개발사들이 차세대 모델의 성능 개선을 발표하면서 제시한 내용들은 미국대학입학자격시험(SAT), 미국대학원수학자격시험(GRE), 변호사 시험 등과 같은 수치화된 평가지표가 대부분이었다.
업계에서는 이번 연구 결과와 관련해 정보처리 등에 초점이 맞춰져 있던 생성형AI 기술이 향후 인간의 감정과 관련된 분야로 쓰임새가 확장될 수 있다는 것을 시사한다고 평가한다. 연구진은 “이번 연구결과는 AI가 이론적 지식 및 의미론적 지식을 보유하는 것 외에도 여러 시나리오의 행동 묘사로부터 AI가 감정을 성공적으로 식별하고 설명할 수 있다는 것을 보여줬다”며 “정신과적 업무에서도 단순히 행정, 사무 업무를 보조하는 것을 넘어 심리치료의 핵심 기술로 쓰일 수 있는 가능성을 보였다”고 설명했다.
이번 연구 결과 등을 바탕으로 AI 업계 또한 사람의 감성을 헤아리는 AI 서비스 출시를 위한 작업을 진행 중이다. 네이버의 초거대언어모델(LLM) ‘하이퍼클로바’를 활용한 ‘클로바케어콜’은 AI가 주기적으로 전화를 걸어 돌봄 대상자들의 식사를 비롯해 수면, 복약 상태 등을 확인해 준다. 여기에 더해 사람과 같은 자연스러운 대화로 돌봄 대상자들의 정서적 안정에도 기여하고 있다.
SK텔레콤 또한 올 4월 챗봇형 AI ‘이루다’ 개발사 ‘스캐터랩’에 150억 원의 지분 투자를 단행하며 AI를 활용한 감정노동 서비스를 준비중이다. SK텔레콤은 향후 스캐터랩과 기술 협력을 통해 감성에 기반한 대화가 가능한 언어모델을 개발할 것으로 전해졌다. KT 역시 자사 AI 모델을 활용해 독거노인 등 취약계층 돌봄 등 AI 헬스케어 서비스를 출시한다는 방침이다.
이성엽 고려대 기술경영대학원 교수는 “네이버에서 개발 중인 AI 기술만 봐도 당장 사람 못지 않게 대화의 맥락을 기억하면서 자연스러운 대화를 하고 있다”며 “AI가 특이점을 넘어서 인간과 비슷해져가는 지금까지의 기술 동향을 보면 감성영역까지 이해범위를 넓혀가는 것은 자연스러운 귀결”이라고 말했다.
<허진 기자>