소비·행동양식·정치·성적취향 까지
천문학적 사생활 빅데이타 수집
과거 행적으로 미래 행동 예측까지
이용자 생각까지 들여다보는 구글
구글이나 페북과 같은 초거대 글로벌 IT 기업들이 상당한 양의 사용자 개인정보를 파악하고 있다는 것은 더 이상 비밀도 아니다. 사용자의 검색기록, 위치정보, 심지어 음성 검색정보까지도 기록되고 저장된다. 모두 광고를 팔기 위해서다. 하지만, 많은 사용자들은 사생활정보가 하나로 통합되고, 분석되고 있다는 사실은 잘 알지 못한다. 지난 2015년 사용자 개인정보가 통합되는 허브인 ‘마이 어카운트’를 도입했던, 구글은 2016년 ‘마이 액티비티’라는 새로운 툴을 도입해, 사용자의 사생활정보를 분석해 장래 행동까지도 예측하고 있다. 구글의 방대한 사생활정보 수집 실태를 들여다봤다.
■아버지도 모른 10대 딸의 임신
미네아 폴리스의 한 타겟 매장에 한 중년 남성이 성난 표정으로 찾아와 매니저를 불러달라고 요구했다. 타겟 매장에서 보낸 할인 쿠폰이 문제였다.
고등학생인 딸이 타겟으로부터 받은 것은 신생아 의류와 수유제품을 할인해주는 임산부용 쿠폰이었던 것.
영문도 모른 채 불려나온 매니저에게 남성은 다짜고짜 따졌다. “당신들 제정신이냐? 내 딸은 지금 고등학생인데 내 딸에게 임신하라고 부추기는 거냐? 도대체 무슨 생각으로 임산부에게 보낼 쿠폰을 딸에게 보냈나?” 주소와 이름을 꼼꼼히 확인해 본 매니저는 정중히 사과할 수밖에 없었다. 하지만, 며칠 후 상황은 역전됐다. 재차 사과를 위해 전화를 매니저에게 중년남성이 오히려 사과를 했던 것. “미안합니다. 알고 보니 딸이 8월 출산예정입니다. 전혀 몰랐습니다”
어떻게 된 것일까? 아버지도 몰랐던 딸의 임신을 ‘타겟’은 어떻게 알게 됐나? ‘플러그드인투타겟‘(Plugged into Target)이라는 고객추적시스템(custmer tracking technology)의 결과였다. 딸의 인터넷 검색을 분석한 이 시스템이 10대 소녀의 ’임신‘사실을 유추해낸 것. 이는 지난 2012년 2월 뉴욕타임스의 기사 중 일부로 기업이 가족보다 때론 자기 자신보다 자신을 더 잘 알고 있을 수 있다는 것을 보여준 에피소드이다.
■구글만 안 청와대 비선진료
그렇다면 매순간 전 세계 인터넷 사용자들로부터 천문학적인 규모로 사생활 빅데이타를 수집하는 ‘구글’은 도대체 어디까지 얼마나 우리 자신을 알고 있는 것일까?
박근혜·최순실 게이트 수사가 한창이던 지난 4월. 박영수 특검팀은 혐의 사실을 부인하던 ‘비을 선진료’ 김영재 원장의 청와대 출입사실을 구글을 통해 확인할 수 있었다.
구글이 수집해 보관하고 있던 김씨의 타임라인 위치기록 정보가 김씨의 청와대 출입사실을 확인해줬던 것. 특검은 구글의 이 타임라인 서비스를 통해 김씨의 지난 수년간의 동선과 행정을 속속들이 파악할 수 있었다.
김씨가 상파울루와 아부다비 등 외국에 나간 적이 있는데 그 날짜를 보면 언제 공항이 갔는지 등 전 세계 어디든 그의 동선은 구글의 타임라인에 기록되고 있었다.
■구글이 들여다보는 나의 삶
현대인들은 이미 다양한 개인정보나 사생활 정보를 크레딧카드사나 유통업체, 은행 등에 노출하거나 스스로 제공하고 있지만 ‘구글’이나 ‘페이스북’과 같은 검색 업체나 초거대 SNS에 흘리는 정보량은 상상을 초월한다. 거의 한 사람의 삶 전체를 속속들이 보여주고 있는 것과 다르지 않다.
사용자가 노출하는 대부분의 정보가 일상의 소소한 사생활 정보인 ‘페이스북’이 가장 빈번하게 사생활 침해 논란을 휘말리지만 사실 정작 은밀한 곳에서 소리나지 않게 이용자들을 속속들이 들여다보고 있는 것은 바로 ‘구글’이다.
거의 무제한 무료로 사용할 수 있는 편리함 때문에 대부분의 인터넷 사용자들이 사용하고 있는 G메일, 가장 많은 사용자를 확보하고 있는 구글의 웹브라우저 ‘크롬’, 최대 동영상 사이트 ‘유튜브’, 구글의 혠 서비스 ‘G맵’, 검색엔진 ‘구글’, 방대한 지식의 보고 ‘구글Docs’ 이 단 하나의 구글 계정에 연계돼 한 개인의 삶 전체가 재구성되고 있다.
‘크롬’의 웹브라우징 기록과 검색엔진 ‘구글’의 검색기록은 사용자가 무슨 생각을 하고 있는 지, 무엇을 하려고 하는 지는 물론 정치적인 성향과 행동패턴, 사고유형까지 유추하고 사용자의 미래 행동까지 예측할 수 있게 해 준다.
또, 수년이 지나도 구글이 보관하는 ‘G맵’의 타임라인 기록은 나의 과거 행적과 동선을 그대로 보여준다. 내가 이미 잊었던 과거조차 구글은 기억하고 있는 셈이다.
■무엇을 사려는 지 구글은 안다.
50대 박강열씨는 최근 인터넷 웹브라우징을 하다 이상한 경험을 했다. 자신이 구매하려고 마음먹었던 제품들이 신기하게도 인터넷을 사용할 때마다 광고로 뜨기 시작한 것. 처음엔 우연이라고 생각했지만, 자신이 사려고 하는 아이템이 있을 때마다 전혀 관련 없는 사이트에서조차 바로 그 아이템 광고가 뜨는 현상을 발견한 것.
“소파를 사려는데 마침 소파 광고가 뜨더니 카펫을 사려고 계획 중인데 또 카펫 광고가 뜨는 거에요. 우연이라고 생각했는데 나중에 알고 보니 그게 아니었어요” 구글 계정을 가진 박씨는 검색과 웹브라우징 데이터를 구글의 똑똑한 알고리즘이 분석해 박씨가 구매하려는 아이템을 간파해 광고로 연결하고 있었던 것이다.
■구글은 나를 어떻게 생각하나?
‘구글의 안드로이드 운영체제는 스파트폰, 태블릿 등 전 세계 모바일의 85%를 점유하고, 구글은 전 세계 검색시작의 92%를 장악하고 있다. 이뿐 아니다. 여기에 G메일, G맵, 구글캘린더, 유튜브 등을 통해 수집되는 개인정보량은 상상을 초월한다. 구글이 하루 처리하는 데이터양은 지난 2009년 이미 24페타바이트(1페타=10의 15제곱, 즉 1,000테라)분량에 달한다’(한국일보 7월 15일자 보도)
GPS를 통해 사용자가 이동한 장소와 시간이 타임라인 정보가 타임라인에 기록되고, 이 정보는 구글 캘린더와 G메일 정보, SNS 정보와 합쳐져 분석되면 누구를 어디서 만나 어떤 화제로 대화를 나눴는지 유추가 가능하고, 검색기록과 웹브라우징 기록이 합쳐지면 개인의 취향과 욕망, 정치성향까지 들여다 볼 수 있다.
사용자의 머리 속 생각까지 들여다 볼 정도가 된 구글은 과연 나를 어떻게 생각하고 있을까?
■“당신은 동성애자?” 성적취향도
구글로 메일을 보내고, 검색을 하고, 일정을 저장하고, 메모를 하며, 구글 GPS를 켜고 운전을 하며, 유튜브로 영화와 드라마를 시청한다. 페북 역시 마찬가지다.
내가 좋아한 게시물, 가입한 클럽을 통해 나의 정치성향이나 성적취향도 파악할 수 있다. 일거수일투족 감시를 받고 있는 것과 다르지 않다. 구글이나 페북은 이 데이터를 취합하면 한 개인의 삶 전체를 구성할 수 있을 정도의 방대한 사생활 정보를 구축하게 된다.
어쩌면 본인 자신보다 더 한 개인을 잘 알고 있을지도 모른다. 60여개에 달하는 서비스를 제공하는 구글의 개인정보 파악능력은 상상을 초월할 것이다.
이런 구글이 나에 대해 어떻게 생각하고 있을지 궁금해진다. 나에 대한 구글의 생각은 구글이 웹브라우저에 띠우는 광고나 검색 시에 자동으로 완성되는 검색어에서 드러난다. 사용자에게 맞춤 제공하는 광고를 보면, 사용자에 대한 구글의 생각을 알 수 있다.
■‘편리함’과 맞바꾼 사생활 정보
구글이 방대한 개인정보를 수집할 수 있는 것은 사용자들이 구글이 제공하는 다양한 서비스를 사용하는 ‘편리함’ 대신 자신의 개인정보를 제공하는 데 동의했기 때문이다. 일종의 ‘딜’을 한 셈이다. 구글은 이 개인정보를 광고주와 기업들에게 판매한다.
구글계정에서 ‘웹 & 앱스’(Web & App Activity)사이트를 방문하면, 구글이 현재 들여다보고 있는 사용자 정보를 한 눈에 볼 수 있다. 또, ‘광고 세팅’(Ads Settings)에 가보면, 구글이 사용자 개인을 어떤 사람으로 파악하는 지 알 수 있다.
사용자의 개인정보 유출을 최소화하기 위해서는 이 설정단계에서 웹브라우저, 유튜브 등 사용자의 사용이력 보관기관을 최단기간으로 설정해하고 공개범위도 최소화하는 것이 좋다.
구글의 GPS 서비스를 스마트폰에서 지워도 구글플레이를 통해 위치정보가 추적되고 있다는 지적도 있지만, 설정만 제대로 관리해도 개인정보 유출을 최소화하고 광고노출도 줄일 수 있다. 하지만, 상당한 불편함이 따르게 돼 사용자가 선택해야 한다.
통합서비스로 제공되는 ‘구글플러스’ 사용 시에는 더 각별한 주의가 필요하다. 구글판 SNS인 구글플러스는 G메일 하나로 구글의 모든 서비스를 통합 관리할 수 있어 편리하지만 산재한 개인정보가 집대성돼 사생활이 유출될 위험이 있다. <김상목 기자>
하루 24페타바이트 분량의 방대한 개인 사생활 정보 빅데이터가 수집보관되는 구글의 대규모 서버시설