はじめますか?
コンテクスチュアルターゲティングによるUAキャンペーンをはじめる
今秋リリースされるiOS14により、IDFAの取得がオプトインに変更され、広告主はユーザーベースのターゲティングソリューション以外の方法で、競争力のあるCPIと価値のあるユーザーを獲得するという課題が出てきましたが、アプリを成長させるという最終的な目標に変わりはありません。
コンテクスチュアルターゲティングために、弊社では ELMo と呼ばれる方法を使用して各バンドルをベクトル化して表します。これにより、アプリのコンテクスチュアル距離を測定することができ、 計算された距離を予測ターゲティングに反映 させ、これは入札のロジックにとても重要な役割を果たします。
弊社では、 コンテクスチュアル距離計算機を作成しました。この計算機は、各アプリストアに表示されているアプリ説明文からアプリの仕組み、テーマ、機能またそれ以上の情報比較に基づき、類似アプリを表示させます。
関連するコンテクスチュアル でインストールや課金ユーザーの予測モデルを構築する際、二つの異なるコンテクスチュアルを考慮しました。コンテクスチュアルは、ユーザー行動とエンゲージメントを予測する上で重要な役割を果たします。
AOSの懸念点でもあるストア内でレンダリングの 固有のバイアス や 不正確さ を使用している場合もあり、アプリストアのカテゴリは重要視できず、またトピックモデル(例:LDA、W2V)を使ったクラスタリングによるカテゴリの作成からも目標とする情報は生成できませんでした。様々なテストの結果、個々のバンドルに対して 最適なバンドルを一つずつ探しあてる必要性があることが分かりました。
言語表現の問題を機械学習により解決するために、一般的に使用される様々なツールを比較検討しましたが、 最終的にElMoにいきつきました。ElMoは、ニュートラルネットワークを使用して、55億の巨大なトークン(単語と単語の基礎をなす部分も含む)によりデータセット内でどの単語が使用されているかを学習することによって行われます。
ELMoモデルが作成された後、 各単語をベクトル化して表します。これにより、各単語間のコサイン距離を測定できます。これは、単語間の類似性のレベルを示します。各単語を考慮することはコンテンツを理解する上で重要であるため、ELMoは複雑なタスクにとって最も信頼できるオプションの一つであることが証明されています。
コサイン距離測定による単語ベクトルとコンテクスチュアルが近距離である一例
バンドルベクトルが単語と重み付けされた集合体からどのように形成されるかの描写
単語ベクトルを生成した後、次のステップではコンテクスチュアルを効果的にする為に、バンドルごとに単語ベクトルを集約します。これにより、アプリ説明文の単語が重要な単語であるかそうでないかを学習することもでき、また異なるアプリ間のコンテクスチュアルの「距離」を測定できます。
私たちの 研究開発プロセス においてこのステップは最も複雑であることが分かりました。アプリストアの説明文にあるすべての単語ベクトルを単純に平均化することは合理的に思えますが、特定の単語や複数使用される単語、特定のアプリにしか使われない説明文やコーパス全体で貴重なデータが失われることもあり膨大な作業になります。
数々のテストを繰り返し、 テストで最も多くの情報を得られたのはNLP (自然言語処理、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術)、そして、TFIDF(文書中に含まれる単語の重要度を評価する手法の1つであり、主に情報検索やトピック分析などの分野で用いられている)をコーパス内で使用する方法になりました。
結論:バンドルに表すには、平均的な各単語ベクトルとTFIDFを掛けたもので、レアな単語や微妙な差異の単語、各アプリのテーマや機能が重要になります。これにより、精度の高いターゲティングモデルを実現しています。
コンテクスチュアルターゲティングによるUAキャンペーンをはじめる