시작하시겠어요?
컨텍스트 타겟팅을 기반으로 효과적인 머신러닝 기반 UA캠페인 운영하기
iOS 14의 IDFA 폐지로 인해 광고주는 성장이라는 동일한 목표 하에 경쟁력있는 CPI와 가치있는 사용자 확보를 위한 대체 비사용자 기반 타겟팅 솔루션을 찾는 데 어려움을 겪고 있습니다.
컨텍스트 타켓팅이 중앙무대를 차지함에 따라, 각 스토어 카테고리에서 쉽게 조작될 수 있는 정보 이외의 정보를 수집하기 위해, 당사는 앱 사이의 컨텍스트 ‘거리′를 측정함으로써 각 번들을 벡터로 표현하기 위해 단어 표현 방법이라 불리는 ELMo를 사용합니다. 이 계산된 거리는 다른 수백가지 특징 중의 하나로 당사의 예측 모델에 제공되며 당사의 비딩 로직에서 중요한 역할을 합니다.
이 방법의 효과를 보여드리기 위해 컨텍스트 거리 계산기를 제작하였습니다. 계산기를 사용하면 각 앱스토어 소개문 간의 정교한 비교를 통해 작동방식, 테마, 특징 등이 가장 유사한 앱을 알 수 있습니다.
설치 및 구매 예측 모델을 위한 컨텍스트 유사 기능을 개발할 때 두 가지 주요 원칙을 고려했습니다: 첫째, 컨텍스트는 사용자 행동 및 광고 참여를 예측하는 데 중요한 역할을 하고, 둘째, 컨텍스트는 상당히 미묘한 차이가 있을 수 있습니다.
이 개념은 내재된 편견을 포함하고 경우에 따라 ASO 문제로 인한 노골적인 부정확성 및 주제 모델링 방법(예: LDA나 W2V)을 사용하여 클러스터링하는 직접 카테고리를 만드는 것과 같은 다른 접근 방식을 포함하므로 스토어 카테고리 사용을 무의미하게 만들며 우리가 목표로 한 정보 획득과 정확성 향상을 생성하고, 우리는 각각의 모든 번들을 개별적으로 표현할 방법을 찾아야 한다는 것을 깨달았습니다.
기계 학습의 언어 관련 문제를 해결하는 데 일반적으로 사용되는 작업의 복잡성과 도구를 평가한 후, 당사 데이터 사이언티스트의 연구를 통해 ELMo를 테스트하는 것으로 결론지었습니다. ELMo는 55억 개의 방대한 토큰(단어 및 구성 부분) 데이터 세트 내에서 사용되는 구문을 학습함으로써 서로 다른 컨텍스트를 사용할 때 단어와 의미 간의 연관성을 학습하기 위해 신경망을 사용합니다.
ELMo 모델이 학습된 후 각 단어를 벡터로 표현하여 의미체계의 레벨과 구문간의 유사성을 알려주는 각 단어 사이의 코사인 거리를 측정할 수 있습니다. 각 단어는 컨텍스트를 이해하는 것이 매우 중요하므로, ELMo는 복잡한 작업을 위한 가장 신뢰할 수 있는 방법이라는 것이 입증되었습니다.
유사성 거리에 의해 효과적으로 측정되는 동안 단어 벡터가 컨텍스트 상황에 따라 얼마나 가까운지에 대한 예시
단어의 가중합에서 번들 벡터가 생성되는 모습
단어 벡터를 생성한 후 다음 단계는 컨텍스트를 효과적으로 표현하는 방식으로 각 번들에 대해 단어벡터를 합하는 것입니다. 표면적으로는 앱스토어 소개문 전체를 단일 벡터 표현에 포함하여 서로 다른 앱 간의 컨텍스트 '거리'를 측정할 수 있습니다.
당사 연구 개발 과정에서 이 단계가 가장 난해한 것으로 밝혀졌습니다. 앱스토어 소개문에 있는 모든 단어의 벡터를 평균화하는 것만으로도 충분해 보이지만 특정 앱의 스토어 소개문 및 전체 말뭉치 내에서 특정 단어가 나타나거나 반복되는 빈도와 관련된 귀중한 데이터를 잃어 버리게 됩니다.
많은 테스트 후 가장 많은 정보를 얻을 수 있는 접근 방식은 NLP(자연어처리, 텍스트 분석에 중점을 둔 기계 학습의 한 분야) -TFIDF-Term Frequency Inverse (to) Document 빈도 : 기본적으로 말뭉치 내 특정 단어의 희소성을 나타냄 - 의 주요 수치 통계를 기반임을 발견했습니다.
따라서, 번들 표현은 각 앱의 고유 테마, 작동방식 및 기능을 일반적으로 표현하는 더 희귀하고 미묘한 단어에 중점을 두기 위해 각 단어 벡터의 가중 평균에 TFIDF값을 곱하여 매우 세분화되어 있지만 가치있는 정보를 제공하는 모델로 발전하였습니다.
컨텍스트 타겟팅을 기반으로 효과적인 머신러닝 기반 UA캠페인 운영하기