구글이 보여주지 않는 것

Living

구글이 보여주지 않는 것

2022-04-22T09:04:26+00:00 2022.04.22|

구글이 온라인 세계를 장악해왔다. 그러다 보니 더 나은 검색이 무엇인지 놓치곤 한다.

최근 나는 아파트 부엌에 있는 토스터를 교체할 생각으로 휴대폰으로 구글에 ‘최고의 토스터’를 검색했다. 검색 결과는 즉시 발뮤다, 헤이, 스메그 같은 하이 디자인 브랜드의 제품을 줄줄이 내놓았다(양심 고백: 사실 전에 일본 브랜드 발뮤다의 스팀 토스터를 검색한 적이 있다). 검색 결과 페이지를 아래로 내리자, 아마존이나 웨이페어 같은 온라인 쇼핑 플랫폼의 광고가 있었고, 유저 리뷰 점수에 따른 ‘인기 토스터’가 또 한 무더기 나온 후 “이런 문의가 있습니다(‘비싼 토스터 살 가치가 있을까요?’ ‘100달러 이하 모델 중엔 별로 좋은 게 없어요’ 같은 전자 제품 리뷰와 뉴스 등을 다루는 웹사이트 CNET에서 발췌된 답변)”라는 제목 아래 추천 페이지가 떴다. 스크롤을 내리자 구글의 검색 알고리즘과 제휴 마케팅을 통한 수익 구조를 명백히 보여주는 짤막한 기사에까지 다다를 수 있었다. 잡지 <굿 하우스키핑(Good Housekeeping)>에서 나온 토스터 고르는 팁과 웹사이트 와이어커터(Wirecutter)의 ‘2022년 베스트 4 토스터 오븐’이었다. 더 아래로 내리자, 내가 사는 아파트에서 물리적으로 구매가 가능한 토스터 판매점의 위치를 보여주는 지도가 나왔다. 이 수많은 선택지와 정보 속에서 나는 잠시 길을 잃었지만, 어느 것 하나도 강요받지는 않았다.

맹렬한 기세로 쏟아져 나오는 똑같은 온라인 쇼핑 옵션 때문에, 샌프란시스코에 사는 26세의 채용 소프트웨어 엔지니어 드미트리 브레러턴(Dmitri Brereton)은 “구글 검색은 죽어가고 있다”는 블로그 포스팅을 올렸다. 브레러턴의 주장에 따르면 상품 리뷰나 요리 레시피에 대한 구글 검색엔진의 결과물은 ‘망한 수준’이다. 이런 기본 상태보다 ‘진정한 인류’라면 어떻게 생각하는지 궁금한 사람들은 검색어에 ‘레딧(Reddit)’ 같은 것을 추가해 관련도 높은 결과물을 찾아내곤 한다. 예를 들면 레딧 사이트의 ‘인생템(Buy It for Life)’ 게시판에는 구소련 시대의 토스터, 복각한 빈티지 토스터 혹은 나만큼 나이 먹은 토스터를 자랑하는 사람들을 볼 수 있다. “구글은 죽었다. 구글+‘site:reddit.com’이여, 만수무강하소서”로 마무리되는 브레러턴의 포스팅은 테크 산업 관련 토론 게시판인 해커 뉴스(Hacker News)에서 가장 많은 지지를 받은 링크 10위가 되었다. 11위 포스팅은 구글의 검색 결과가 광고와 거의 비슷하다는 것이며, 12위는 구글 검색의 대체제인 인디 검색엔진의 링크였다. 이것만 봐도 다른 사람들이 브레러턴의 검색엔진에 대한 불만에 공감하고 있음을 알 수 있다.

브레러턴은 2020년 말부터 검색엔진에 대한 실망이 시작됐다고 말한다. “하루는 웹 서핑을 하는데, 뭔가 제대로 안 된다는 느낌을 받았어요. 콘텐츠는 많은데, 진짜가 없는 느낌이더라고요.” 그는 온라인에서 정보가 어떻게 정리되는지에 대한 개인적인 조사였던 포스팅의 주체할 수 없는 인기에 어안이 벙벙했다. SNS나 토론 게시판, 개인 블로그에 더 좋은 정보가 있었지만 구글 검색은 이런 플랫폼에 있는 정보보다는 구글 검색 알고리즘을 최적화하는 데 드는 비용과 인력을 감당할 수 있는 기업 웹사이트를 우선시한다. ‘진정한 인터넷’이란 마치 숨겨진 것 같았다고 브레러턴은 말했다. “알고리즘이 우리가 뭘 볼지 정해주죠.”

구글 검색은 전 세계 검색엔진 시장의 85%를 점유한다. 우리가 경험하는 인터넷의 매우 큰 부분을 오랫동안 차지해온 나머지, 다른 것을 상상하기 어려울 정도이다. 오늘날의 구글 검색 페이지는 처음 론칭한 1998년과 전체적으로 동일한 디자인으로, 흰 바탕에 푸른색으로 링크를 보여준다. 구글 공동 창립자 세르게이 브린과 래리 페이지는 사업을 시작할 때부터 유용한 검색 결과와 수익성이 있는 결과의 간극을 알아차렸다. 이들은 1998년 스탠퍼드 재학 시절의 논문에 “광고 수익 모델의 목표가 유저에게 고품질의 결과를 제공하는 것과 항상 부합하지 않는다”고 적기도 했다. 인터넷 광고는 2000년에 처음 도입되어 계속 번창하고 있다. 웹사이트 연결 링크가 검색 결과에 포함되었고, 심지어 유저가 클릭할 필요도 없게 웹사이트의 본문을 일부 바로 발췌해 보여주는 ‘빠른 답변’이 생겨났다. 지난 수십 년간 검색엔진의 최적화는 유저에게 정보를 제공하기 위함만이 아니고 구글 페이지에서 눈에 띄는 순위를 매길 수 있는 콘텐츠가 만들어진 것이다. 아마 내가 토스터를 검색했을 때 중복되는 결과가 많이 나온 이유 중 하나일 것이라고 생각한다. 개별 사이트가 똑같은 알고리즘에 의해 작동하기 때문이다.

개인 정보 보호에 중점을 둔 검색엔진 기업 덕덕고(DuckDuckGo)의 CEO 가브리엘 와인버그(Gabriel Weinberg)는 구글 검색에 대한 불만족 요인으로 세 가지를 꼽았다. 첫 번째는 유저의 행동을 트래킹하는 행위로 이는 구글이 수익을 얻는 소름 끼치게 계속 나타나는 인터넷 광고를 유도한다. 두 번째는 구글이 검색 결과에서 자체 서비스를 우선 노출한다는 것이다. 예를 들면 여행 관련 검색에 대해서는 트립어드바이저(Tripadvisor)와 같은 유저 간 정보가 많은 소스가 아닌 구글 지역 정보에서 가져온 정보로 ‘빠른 답변’을 제공한다. 마지막으로 유저들은 그저 구글이 지배하는 인터넷 경험에 지쳤다는 것이다. 구글은 아이폰의 기본 검색엔진을 유지하기 위해 애플에 연간 150억 달러 이상을 지불하는 것으로 알려졌다. 구글의 안드로이드 폰에서 선호하는 검색엔진으로 변경하려면 번거로운 설정 조정이 필요하며, 도중에 팝업 메시지를 통해 다시 구글로 돌아가는 것을 유도한다. 와인버그는 “사람들 대부분이 검색엔진을 선택한 적이 없다”는 점을 지적했다.

유저 트래킹을 사용하지 않는 검색엔진 덕덕고는 지난 1년간 예상 유저가 5,000만 명에서 1억 명이 되었고, 검색 트래픽은 월 15억에서 30억으로 두 배로 늘어났다. 덕덕고는 유저의 행동 패턴보다는 검색어 기반으로 광고를 제공한다. 와인버그에 따르면 “덕덕고에서 검색하는 것은 매번 처음 검색하는 것”과 같다. 그러나 실제로는 모든 주요 검색엔진이 구글의 독창적인 웹 크롤러와 페이지랭크 기술에 의해 설정된 템플릿을 기반으로 작동하기 때문에, 기존 검색엔진 가운데 골라 쓰는 것이 검색 결과에 미치는 영향은 미미하다. 덕덕고의 경우 마이크로소프트의 빙(Bing)이 제공하는 검색 알고리즘을 크게 활용한다. 덕덕고에서 ‘최고의 토스터’를 검색하면 광고, 판매 알림, 제휴 마케팅 목록과 함께 구글과 거의 동일한 검색 결과를 얻을 수 있다. (최근 <타임>지는 구글의 결과가 검열되고 있다고 생각하는 음모론자들 사이에서 덕덕고가 인기를 얻는다고 보도했지만, 덕덕고는 구글보다 더 논의할 거리가 많은 콘텐츠를 검색 결과로 노출하고 있다고 주장했다.)

마르기날리아(Marginalia)라는 인디 검색엔진을 개발한 스웨덴 출신의 소프트웨어 개발자 빅토르 뢰프그렌(Viktor Löfgren)에 따르면 “검색 결과의 차이점이 별로 없는 것은 추천과 예상 알고리즘이 아주 잘 작동하기 때문일 수”도 있다. 지난해에 뢰프그렌이 만들어낸 이 검색엔진은 그의 거실에 있는 컴퓨터로 실행되는 기본적인 형태의 웹사이트다. 이 개인 검색엔진의 목적은 “유저들이 모를 만한 사이트를 보여주는 것”이다. 마르기날리아의 검색 결과는 그만의 커스텀 알고리즘과 데이터 수집 시스템에 바탕을 두고 있으며, 광고가 없고 모바일 환경을 지원하며 암호화와 최적화가 잘되어 있는 텍스트 기반 웹사이트를 우선 노출한다. “구글은 최신 웹 기술에 맞추지 않는 사이트는 저버립니다. 오래된 웹사이트는 주의를 기울여야 해요.” 마르기날리아에 ‘최고의 토스터’를 검색하면 1990년대의 기술 관련 블로그부터 현대의 테크 기업에 대한 오래된 인터넷 농담, “만약 애플이 토스터를 만들었다면… 마이크로소프트의 토스터가 가진 모든 기능을 갖췄을 겁니다. 하지만 5년 빨리 출시했겠죠”까지 결과에 나온다. 검색 결과 페이지에 이미지는 없으며, 텍스트로 된 검색 결과만 나오거나 ‘바로 구매’ 버튼 정도가 있다. 마르기날리아의 검색 결과는 새로운 기기를 보여주지는 않지만, 인터넷에 얼마나 많은 정보가 있으며, 그 정보가 구글 검색 결과처럼 맨 앞에 노출되지 않는다는 사실을 보여준다.

구글 검색의 대외 담당자 대니 설리번(Danny Sullivan)은 사람들이 레딧의 스레드를 찾기 위해 구글을 사용한다는 것이 실제로 검색이 제대로 작동하고 있다는 증거라고 강변한다. 수동적으로 변해버린 유저들은 구글이 자신들의 기대를 충족시켜주기를 바란다. 이를테면 검색어를 구체화하거나 가격대(토스터 40~100달러)를 설정하거나, 제외할 특정 용어를 나열(‘오븐’ 말고 ‘토스터’ 검색)해 결과를 제한할 수 있는 것이다. 머신러닝 알고리즘이 한층 널리 보급되면서, 인터넷 유저들은 고등학생 컴퓨터 참고서에도 나올 법한 검색 능력을 잃었다. 설리번은 “바로 원하는 것을 찾지 못하면 검색엔진을 탓하는 변화가 일어나고 있습니다”라며 많은 사용자가 “좀 더 비상업적이면서 더 많은 커뮤니티 기반 정보를 원한다”고 말했다.

원하기만 하면 구글은 검색 알고리즘을 조정해 레딧뿐 아니라 기타 SNS에 대한 우선순위를 지정함으로써 더 많은 콘텐츠를 ‘빠른 답변’으로 끌어올 수 있다. 이미 구글의 알고리즘은 끊임없이 변화하고 있다. 예를 들어 2020년에 나는 구글 이미지 검색 결과가 무드보드 사이트인 핀터레스트(Pinterest)의 이미지를 보여주며, 식별 제목이나 출처 정보가 없는 경우가 많다는 사실을 알아차렸다. (알아차린 건 나뿐 아니었다. 이 사실을 트위터에 올리자마자 거의 10만 개의 ‘좋아요’를 받았다.) 핀터레스트는 더 많은 방문자를 끌어들이기 위해 이미지 검색 알고리즘의 특이점을 통해 검색 시스템을 이용한 것이다. 그러나 이제 더 이상 핀터레스트는 나의 검색 결과에 자주 나오지 않는다. 이 사실에 대해 설리번에게 묻자 최근 구글이 “도메인의 다양성을 높인다”고 알려줬다.

어떤 유저들이 검색 결과에서 ‘진실성’을 원하더라도, 궁극적으로 검색엔진은 답을 찾기 위해 만들어진 편리한 자동화 도구다. 완전 자동화되지 않은 검색엔진은 아마도 그래픽 디자이너와 아트 디렉터 사이에서 인기 있는 일종의 ‘힙스터용 핀터레스트’인 아레나(Are.na, 2011년 설립)와 같은 형태일 것이다. 아레나의 유저들은 이미지, 영상, 텍스트를 이용해 자신만의 테마 보드를 만들 수 있다. 이를테면 ‘쿨한 포토그래퍼’ ‘미친 디자인의 로고’ ‘의미 있는 의상 디자인’ 같은 식이다. 각각의 테마 보드는 세상의 쏟아지는 정보 속에서 손수 고르고 골라낸 것들이다. “아레나는 알고리즘이 아니고 사람의 노동력으로 돌아가는 검색기라고 할 수 있습니다.” 공동 창립자인 다니엘 피아네티(Daniel Pianetti)가 말했다. ‘최고의 토스터’ 같은 테마 보드는 없지만, 스마트 토스터에 대한 기사라든가 DIY 토스터, 예쁜 주방 인테리어에 대한 보드를 볼 수 있다. 아레나의 기본 홈페이지에 있는 가이드에는 “너 자신을 토끼굴로 들어가게 하라”라고 나와 있기도 하다.

아레나 같은 사이트에 끌리는 사람들은 유용한 정보보다는 재밌는 정보에 관심이 있다. 하지만 대부분의 사람들에게는 웨이페어나 아마존에서 판매 중인 토스터에 대한 정보로도 충분할 것이다. 설리번은 브레러턴의 포스팅은 분명 인기 있기는 하지만, 소수의 특정 유저층만 대변한다고 지적했다. “해커 뉴스가 검색 기능을 쓰는 모두의 의견을 대표하지 않으니까요. 검색 결과가 100% 레딧으로만 채워진다고 해도 모두가 만족스럽지는 않을 겁니다.” 나는 이 피상적인 구글 검색 기능을 추가적인 정보 검색 결과(즉 구글링)를 훑어보는 용도로만 사용한다. 구글이 300달러짜리 발뮤다 토스터를 가장 앞에 보여준다고 해서 살 생각은 없었다. 하지만 리뷰를 찾아보면서 혹했음은 인정한다. <와이어드(Wired)> 관계자는 “발뮤다 토스터로 행복해졌다”고 남겼으며, 한 레딧 유저는 “코로나 유행 전에는 그냥 발뮤다 토스터를 쓰기 위해 옆집에 가기도 했다”는 신빙성 넘치는 경험을 공유하기도 했다. 이것이야말로 알고리즘이 전할 수 없는 추천이 아닐까. ((VK)