기획 완결 미디어 프리즘

‘검색하다’가 ‘구글하다’된 세상…

입력 2020. 08. 04   15:57
업데이트 2020. 08. 04   16:31
0 댓글
세계 검색시장 92% 장악… 편리한 ‘맞춤형 서비스’ 이면에 특정한 ‘사고의 울타리’ 갇힐 우려도
필터버블(상): 구글의 개인 추천 알고리즘

인터넷은 1990년대 중반부터 대중화되기 시작했다. 오늘날과 같은 초고속 인터넷망은 상상하기 어려웠고 전화선을 컴퓨터 모뎀에 꽂아서 사용했다. 전송속도가 56k로 매우 느렸기 때문에 동영상이나 고해상도 사진은 전송할 수 없었고 대부분 콘텐츠가 문자로 구성됐다. 당시 세계에서 가장 유명한 사이트는 1995년 탄생한 야후였다. 야후 영문 명칭(Yahoo!)에서 마지막 글자 ‘o’는 오라클에서 따온 것이다. 오라클은 신이 전달하는 진리의 매개자로서 인간의 물음에 대답하는 신탁(神託)을 뜻한다.



야후는 오라클처럼 인터넷 이용자들이 궁금해하는 사항에 대해 답을 쉽게 찾도록 도와주는 매개자 역할을 자처했다. 지금은 다소 황당한 소리로 들릴 수도 있겠지만 과거에는 정보검색사라는 새로운 자격증을 가진 직업이 생겨날 거라는 전망도 있었다. 인터넷 사이트가 우후죽순 생겨나면서 수많은 사이트 가운데 정부기관이나 기업에 중요한 정보를 찾아주는 직업이 필요하다는 얘기였다. 그러나 정보검색사라는 직업은 탄생하지 못했다. 야후가 인터넷 사이트 디렉토리를 만들어서 제공했기 때문이다. 이용자들은 범주별로 분류된 디렉토리를 따라 들어가서 자신이 원하는 사이트에 쉽게 접속할 수 있었다. 가령, 테니스 선수에 대해 알고 싶으면, 스포츠-인물-테니스 순으로 클릭하여 해당 선수에 대한 정보를 찾아볼 수 있었다. 야후는 디렉토리 이외에도 이메일과 뉴스를 제공하면서 하루 1억 가까운 페이지뷰를 기록하면서 가장 인기 있는 포털 사이트로 등극했다. 야후 주식 가격은 2년 사이 600%나 상승할 정도였다.



야후 주가가 치솟을 즈음 야후의 시장을 잠식할 새로운 기업이 창업됐는데, 그것이 바로 래리 페이지와 세르게이 브린 등이 만든 구글이다. 당시 스탠퍼드대학교에서 박사과정을 밟고 있던 페이지와 브린은 웹페이지 사이의 연결구조를 분석하는 데 관심을 갖고 있었다. 웹페이지가 서로 고립되어 존재하는 것이 아니라 상호 연결과 참조 관계에 있음을 깨닫고, 이들은 각 웹페이지의 중요도를 수학적으로 계산하는 방법을 창안하는 데 골몰했다. 수천만 개의 웹페이지가 서로 어떻게 연결돼 있는지 분석한 후 중요도 순으로 나열할 수 있다면 필요한 정보를 찾기가 용이하다. 그리하여 그들은 1997년 20대 중반의 나이에 ‘구글’이라는 검색엔진을 개발했다. 부모님, 교수님, 친구들이 출자해 준 돈으로 한 은행의 주차용 창고를 임차했다. 이후 구글 검색엔진은 야후를 제치고 가장 각광받는 서비스로 성장했다. 야후는 이용자가 여러 단계로 등록된 디렉토리를 따라서 원하는 정보를 찾아야 했기에 불편했지만, 구글은 검색어만 입력하면 이용자가 원하는 웹페이지를 척척 찾아주었다. 현재 구글 이용자는 자연스럽게 받아들이겠지만, 과거 야후를 이용하던 사람들은 구글이 자신의 욕구를 어쩌면 이렇게 잘 파악하는지 신기하게 생각했다.



구글이 야후를 누를 수 있었던 데에는 컴퓨터 연산기술이 결정적으로 공헌했다. 야후의 디렉토리는 사람이 일일이 편집했다. 따라서 방대한 웹페이지를 분류하는 데 많은 시간이 걸렸다. 반면, 구글은 웹페이지 분석을 컴퓨터로 자동화했다. 오늘날 빅데이터 분석, 알고리즘, 인공지능과 같은 말로 통용되고 있는 컴퓨터 연산기술을 적용한 것이다. 구글 검색 알고리즘은 창업자의 이름을 따서 ‘페이지 랭크’라고 불린다. 페이지 랭크의 기본 원리는 네트워크 중심성이다.

간단히 예를 들어 4개의 웹페이지가 존재할 때, A는 다른 3개 웹페이지와 모두 연결돼 있고 B와 C는 2개만 연결되고, D는 1개만 연결된다면 검색 결과에서 A를 가장 상위에 랭크하고 D는 가장 하위에 랭크하는 방식이다. 현실에는 수억 개의 웹페이지가 존재하므로 웹페이지를 검색어 혹은 쿼리 값에 따라서 배열하는 것은 고난도 작업이다.



구글은 이에 만족하지 않고 2009년부터 검색 결과를 개인 맞춤형으로 보여주기 시작했다. 이전에는 동일한 검색어는 동일한 검색 결과를 이용자들에게 보여줬지만 이제는 50가지 요인에 따라서 이용자별로 상이한 결과를 보여준다. 50가지 개인 맞춤형 요인 중에는 이용자가 위치한 장소가 큰 부분을 차지한다. 스마트폰의 GPS 정보나 컴퓨터의 IP주소를 기반으로 이용자가 어디에서 검색어를 입력했는가에 따라 검색결과가 달라진다. ‘트럼프’ 대통령을 검색했다고 가정하면, 그에 대한 지지도가 높은 중소도시에서 검색어를 입력했는가 아니면 지지도가 낮은 대도시 지역에서 입력했는가에 따라 다른 순위의 검색 결과를 보여준다. 쿠키로 저장된 검색 이력과 웹페이지 방문 이력도 개인 맞춤형 서비스에 활용된다. 이용자가 뉴욕타임스를 검색하거나 방문한 이력이 많으면, ‘트럼프’ 대통령을 검색했을 때 뉴욕타임스의 기사를 상위에 보여준다.



구글은 자체적으로 운영하는 다양한 서비스도 개인 맞춤형 검색 서비스에 활용한다. 최근 서비스를 중단했지만, 소셜네트워크서비스였던 구글+는 연령이나 성별과 같은 개인정보뿐만 아니라 친구들의 성향을 반영하여 개인 맞춤형 검색 결과를 제공하는 데 활용됐다. 친구들과는 관심을 공유하기 때문이다. 이외에도 구글이 제공하는 이메일, 달력, 지도, 앱스토어 등 다양한 서비스 이용 내력도 개인 맞춤형 서비스를 정교하게 다듬는 데 적용된다.



구글의 검색 알고리즘은 이용자의 편의성을 급격히 향상시키고 있다. 인터넷 초창기 야후가 수작업으로 만든 디렉토리와는 비교 대상조차 될 수 없다. 요즘 중국을 제외한 세계 검색시장 점유율에서 구글은 92%, 야후는 3%에 불과하다. 그런데 구글이 제공하는 개인 추천 알고리즘이 긍정적 기능만 갖는 것은 아니다. 구글에 대한 의존도가 높아지면서, 구글의 알고리즘이 사람들이 접근할 수 있는 정보 영역의 울타리를 만든다. ‘필터버블’은 구글의 알고리즘이 정보 접근을 일정 방향으로 유도함으로써 사람들의 사고에 울타리를 만들 수 있다는 우려를 나타낸다.(계속)

<김선호 연세대 언론홍보대학원 겸임교수>

< 저작권자 ⓒ 국방일보, 무단전재 및 재배포 금지 >
댓글 0

오늘의 뉴스

Hot Photo News

많이 본 기사