이끌었다…알고리즘이 나는 여기에

 

출처 : 클립아트코리아

안녕하세요MG새마을 금고입니다. 어느새 우리가 일상 속에서 많은 시간을 보내는 YouTube알고리즘이 작동하고 어느새 자신도 모르게 이 영상을 있는지 몰랐던 것은 없습니까? 저뿐만 아니라 많은 사람들이 저도 모르는 사이에 어떤 특정 영상에 모여서 이런 코멘트를 하는 경우가 종종 있습니다.오늘도 모르는 유튜브 알고리즘은 다시 나를 여기로 보냈다그렇다면 과연 어떻게, 왜 YouTube 알고리즘은 제 피드에 처음에는 몰랐던 동영상을 추천해 주고, 저를 오늘도 미지의 세계에 보내는 것인지, 그 흥미로운 사실을 소개합니다!

알고리즘이 나를 이곳으로 이끌었다…

, 그게 뭐죠?

출처 : 클립아트코리아

알고리즘 (algorithm) 은 주어진 문제를 논리적으로 해결하기 위해 필요한 절차, 방법, 명령어를 모아놓은 것을 말합니다. 예를 들면, 사람과 사람의 대화에서는 단순한 한 문장이지만 그 안에 들어있는 의미까지 파악할 수 있는 사례가 있습니다. 만약 A라는 사람이 B에게 “오늘 학원에서 내준 숙제 다 했니?”라고 물어서 B가 “어, 다 했어!”라고 대답한다면 A는 B의 한 문장 안에서 “국어, 수학, 영어 숙제는 다 했구나”라고 내포되어 있는 의미를 알 수 있습니다.

하지만 컴퓨터의 언어와 프로그래밍 처리 방식으로는 이렇게 내포되어 있는 의미를 사람처럼 한꺼번에 처리할 수 없습니다. 그래서 정확하게 무엇을 해야 하는지, 처리 내용과 처리 순서를 모두 구체적으로 알려줘야 컴퓨터가 제대로 명령을 실행할 수 있습니다. 그렇기 때문에 프로그램에 알고리즘이 필요합니다.

그중 유튜브나 인터넷 플릭스에서 자주 언급되는 ‘알고리즘’은 정확히 말하면 ‘추천 알고리즘(Recommendation Algorithm)’입니다. 추천 알고리즘이란 방대한 데이터 속에서 일정한 규칙에 따라 사용자들이 좋아할 만한 콘텐츠를 추천하여 사용자 만족도를 높이는 기술로, 서비스 기업이 사용자의 플랫폼 체류 시간 및 콘텐츠 운영의 효율성을 높이고 구독자 이탈을 방지하기 위해 보편적으로 적용되고 있는 일종의 전략적 알고리즘입니다.

유튜브 성공 비결.출처 : 방송통신위원회

OTT(Over The Top, 인터넷을 통해 볼 수 있는 TV) 서비스는 이미 일상을 많이 차지하고 있습니다. OTT 서비스 시장의 발전으로 유튜브, 넷플릭스 등의 동영상을 매개로 플랫폼의 전성시대가 열렸습니다. OTT 서비스 채널이 포화되는 가운데 YouTube는 어떻게 1위를 유지하고 있을까요?

유튜브 선택은 바로 맞춤 편성이 가능한 ‘개인화 추천 알고리즘’의 적용이었습니다. YouTube에는, 어느 관심 키워드를 검색해 나온 최초의 동영상에서 「다음의 동영상」에 계속 되는 재기동 재생 리스트가 있습니다. 이것이 알고리즘의 결정체라고 할 수 있습니다.

유튜브 최고상품 담당자(CPO) 닐 모한(Neal Mohan)은 2019년 3월 뉴욕타임스와의 인터뷰에서 “유튜브 이용자의 시청시간 70%가 권장 알고리즘에 의한 결과이며 알고리즘 도입으로 비디오 시청시간이 총 20배 이상 증가했다”고 밝혔습니다.

유튜브와 동영상 스트리밍 플랫폼에서 1위를 다투는 넷플릭스도 알고리즘은 유튜브와 같습니다. 게다가 넷플릭스는 신작이 등록될 때마다 자신에게 맞는 영상인지 분석하고, 넷플릭스 계정에 등록된 자신의 개인 메일로 추천 영상 메일까지 보내줍니다. 이렇게 유튜브나 넷플릭스에서 자동화된 AI 추천 알고리즘을 통해 자신의 취향에 딱 맞는 영상을 추천해 주고, 그게 실제로 맞으니 정말 신기할 것 같아요! 추천 알고리즘도 종류가 있다!

출처 : 클립아트코리아

가끔 소름끼칠 정도로 취향에 딱 맞는 동영상을 추천해 주는 유튜브와 넷플릭스 추천 알고리즘! 그런데 이 추천 알고리즘에도 두 종류가 있다는 거 알고 계셨나요? 추천 알고리즘은 사용자의 이용 형태 분석 또는 콘텐츠를 분석하여 우리에게 딱 맞는 영상을 추천하고 있습니다. 그럼 차근차근 살펴보도록 하겠습니다.

1. 콘텐츠 기반 필터링

먼저 콘텐츠 기반의 필터링은 콘텐츠 정보만으로 다른 콘텐츠를 사용자에게 추천하는 방법입니다. 단순히 영상뿐 아니라 음악, 기사, 쇼핑 목록 등 콘텐츠가 가지고 있는 고유한 특징들을 분석하여 사용자에게 추천하는 방식입니다. 이러한 특징에서 알 수 있듯이 콘텐츠 기반 필터링을 사용하면 콘텐츠를 자체 분석함으로써 초기 사용자의 행동 데이터와는 상관없이 추천할 수 있다는 장점이 있습니다.

단, 콘텐츠만을 분석하기 때문에 부작용이 있을 수 있습니다. 예를 들어 BTS 내 랩몬스터의 팬인 사용자가 랩몬스터의 영상을 검색하여 콘텐츠 데이터를 축적시켰지만, 랩몬스터, BTS그룹, K-POP 아이돌 등 랩몬스터라는 콘텐츠와 중복되는 다른 키워드가 많아 원치 않는 K-POP 그룹이나 다른 그룹 다른 멤버들의 활동 모습이 담긴 콘텐츠를 추천받을 수 있다는 단점이 있습니다. 이와 같이 콘텐츠 기반 필터링은 사용자의 세부적인 성향을 파악하기 어려운 문제가 발생합니다.

<컨텐츠 기반 필터링> 장단점 콘텐츠 자체 분석으로 초기 사용자 행동 데이터가 적어도 추천 가능한 정밀함이 저하되어 세밀한 취향에 깊이 파고들기 어려움

2. 협업 필터링

두 번째 추천 알고리즘인 ‘협업 필터링’은 같은 행동을 한 사람이 한 그룹으로 묶어 그룹 내 다른 사람이 공통으로 보던 콘텐츠를 나에게도 추천하는 방식입니다! 예를 들면, 「취업 활동」에 관한 비슷한 영상을 본 여러가지 사람이 있으면, 그것들을 한 그룹으로 묶은 후, 같은 그룹내의 다른 사람이 본 영상을 나에게도 추천해서 클릭을 유도하는 방법입니다. 그 외에도 쇼핑몰에서 상품을 구입하는 경우, 그 상품을 구입한 사람들이 구입한 다른 상품을 추천 상품으로 보여주거나 SNS 등에서 친구나 친구를 나에게도 친구로 추천해 주는 것 등을 의미합니다.

단, 협업 필터링의 경우는 사용자의 기존 데이터가 존재해야 하기 때문에 기존 데이터가 축적되지 않을 경우 추천이 어렵다는 단점과 함께 한 그룹 내 사용자가 많을수록 알고리즘의 작동 시간이 늦어지는 점, 그리고 다수의 사용자가 관심을 보이는 소수의 콘텐츠가 전체 추천 콘텐츠로 볼 수 있는 비율이 높아져 소외되는 콘텐츠가 발생한다는 한계를 가지고 있습니다.

<협업 필터링> 장단점, 많은 사람들의 기호 정보를 통해 얻어진 것으로 만족한 결과를 도출 할 수 있는 정밀함이 떨어지고 세밀한 취향에 깊이 파고들기 어렵다.

‘추천 알고리즘’은 진화 중!

출처 : MUVI

미국 뉴욕에 본사를 둔 OTT 사업 운영 플랫폼 ‘MUVI’는 2018년 11월 넷플릭스의 급격한 성장을 주목하는 특집기사를 발행하였습니다. 당시 이 글에서 넷플릭스를 ‘왕관뿐만 아니라 OTT 시장의 왕’으로 비유했고, 넷플릭스라는 단일 플랫폼이 할리우드를 넘어 온라인 스트리밍 산업에서 급격한 성장을 할 수 있었던 원인으로 ‘빅 데이터’를 꼽았습니다. WSJ(월스트리트 저널)에 따르면 넷플릭스는 빅데이터 분석을 통해 넷플릭스 내 영상에 대한 퀄리티와 안정성을 최적화하는 동시에, 사용자의 엔터테인먼트 취향을 평가하여 사용자가 넷플릭스에 접속했을 때 가장 잘 보이는 장소에 추천 영상을 제시할 것입니다. 이를 통해 넷플릭스는 사용자를 정확히 타깃으로 삼아 사용자가 좋아할 만한 장르의 영상을 제공하고 있다고 분석했습니다.

또한 넷플릭스는 추천 알고리즘의 두 가지 방식인 ‘콘텐츠 기반 필터링’과 ‘협업 필터링’의 단점을 보완하고 한계를 극복하기 위해 두 가지를 통합한 앙상블 체계를 사용하고 있습니다. 단순한 장르, 주제, 소재, 출연자 등에 국한되지 않고 보다 긴밀한 분석을 통해 최적화된 추천 알고리즘을 적용하고 있다는 것입니다.

추천 알고리즘을 활용하기 쉬워!서비스별로 추천방법 YouTube와 넷플릭스 외에도 추천알고리즘을 반영하여 사용자에게 딱 맞는 영상콘텐츠를 추천하는 플랫폼 서비스가 있습니다. 어떤 것들이 있을까요?

Last.fm

Last.fm은 사용자의 프로필을 바탕으로 사용자의 취향에 맞게 곡을 추천하며, 비슷한 취향의 사용자를 연결하여 라디오 스테이션을 제공해 줍니다. 이때 Last.fm은 Scrobbler라는 프로그램을 통해서 사용자가 듣는 음악을 개인 라이브러리로 기록해 줍니다. Scrobble이란 음악을 듣는 이용자가 자신의 음악 목록을 웹으로 전송하여 기록하는 작업입니다.

웨이브(Wavve)

한국 OTT 플랫폼에서 한 웨이브(Wavve)는 관련 영화 메타를 매칭시키는 플랫폼입니다. 예를 들면, 관련 배우들이 출연한 작품, 관련 감독이 제작한 작품, 비슷한 장르, 함께 많이 본 콘텐츠 등을 추천하는 플랫폼입니다. 또한 태그를 기반으로 한 추천 서비스를 제공하고 있습니다.

바이브(VIBE)

네이버가 개발한 인공지능(AI) 기반의 음악 스트리밍 서비스 ‘VIV’는 개인의 음악 취향을 학습하고 사용자들이 좋아할 만한 음악을 추천하는 플랫폼입니다. 기존의 “네이버 뮤직”을 Vible하게 통합하여 딥러닝을 이용한 오디오 기반의 음악 추천 형식입니다. 바이브는 협업 필터링+콘텐츠 기반 필터링을 합친 ‘하이브리드 추천 시스템’을 사용했습니다. 한 단계 더 나아가 곡 발매와 함께 자동으로 생성되는 객관적인 정보인 ‘아티스트 레이블’을 통해 아티스트를 하나의 작은 장르로 해석하고 사용자에게 추천합니다.

그동안 제 취향을 저보다 더 잘 알고 있는 <유튜브와 넷플릭스의 알고리즘>에 대해 알아봤어요. 어떻게 나한테 딱 맞는 영상을 추천해주는지 이해가 됐나요? 이제 이 플랫폼들이 사용하고 있는 추천 알고리즘이 저에게 영상이 추천된다는 사실을 알고 놀라지 않는 사용자가 되길 바랍니다!